介绍
git地址 github.com/iKubernetes…
google 4个黄金指标
要素
- 监控的目标端点 需要给server
- 通过http协议获取数据
- pull模式 周期性 去target抓数据(scrape)
Exporters
例如mongodb 本身没有对外暴露的endponint 或者 暴露的格式 和promethus不兼容 素以需要加一个中间层 讲两遍的数据 进行转换
instrumentation
通过载入 promethus的SDK 开发自己内置的exporters, http 协议
PushGateway
周期性的作业 运行一段时间就退出了 被监控的对象 将数据推送到PushGateway (daemon方式) promethus 再去 PushGateway 抓取数据
pull便于集中控制 一个节点上可以时间统一定制 每一个对象的抓取周期 以及 打标签
组件
promethus server
-
tsdb
-
scraping组件 支持各种 抓取数据 将数据存储到 storage中
-
cinf
- 静态配置target
- 动态配置 服务发现
-
service disvoer 实现动态配置
- consul
- dns
- file
- ec2
-
Rules and alter 告警规则
-
altermanager 告警动作
- dingtalk
-
dashboards
- grafna
- 自带的
数据格式
能够提供数据的 --- 实例
Alters
如何部署
- 部署server
- 部署节点
- 将节点的expoerter纳入进来
step1 安装promethus-server
周期性的去抓取数据
可以通过balck exporter监控网站的服务情况
部署节点
yum install docker yum install docker-compose
docker yml
基于文件的服务发现
docker-compose up
访问$server:9090端口
将00yml分发到 node节点
docker-compose up
动态服务发现机制
server节点 修改文件配置 然后发现node节点
新增的节点
实验2 使用02目录 通过consul发现节点
访问consul
根据nodes标签去纳管
实验3
本身不支持的系统 通过exporter暴露数据
grafna的密码
可以自己去加 面板
实验4 添加blackbox_exporter监控
将需要监控的网站加入
已经纳管进来了
实验5 添加告警
将失败的指标 进行告警
server定义告警规则
altermanager通过告警媒介 进行通知
基本工作逻辑
告警邮箱配置
定义html模版
指定告警配置
定义告警规则
egm