首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Prometheus
huan1993
创建于2021-05-10
订阅专栏
Prometheus数据监控
暂无订阅
共11篇文章
创建于2021-05-10
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
blackbox_exporter的使用
有些时候,我们想监听服务器的某个端口是否存在,监听http的请求是否正确时,这个时候就可以使用 blackbox_exporter来实现。 blackbox exporter 可以实现对 http,https,tcp(可以实现服务器接口是否在线),icmp(实现主机探活),dn…
SpringBoot整合Prometheus
实现SpringBoot和Prometheus的一个简单整合。 1、启用prometheus端点。 2、给每个指标指定一个通用的标签,application见下方的截图。 3、指定管理的端口和路径。 可以看到里面存在一个 process_files_open_files 指标,…
sql_exporter的使用
有些时候,我们想看每天系统的登录人数、或者系统中订单的数据,比如:成功的订单、异常的订单等等。这些数据都在我们的数据库中,通过sql_exporter我们可以将这些数据接入到prometheus中,进行监控告警。 2、every_day_order_cnt {user_name…
mysqld_exporter监控mysql信息
使用 mysqld_exporter 来抓取 mysql的一些指标信息。 在创建用户的时候,推荐执行 MAX_USER_CONNECTIONS参数,避免我们监控使用过多的数据库连接数,导致数据库压力过大。 在和mysqld_exporter文件同级的文件夹中创建my.cnf文件…
AlertManager集群搭建
单节点的告警管理器,如果宕机了,那么所有的告警信息都发送不出去,还是比较危险的,因此我们需要搭建一个高可用的告警管理器。 此处,记录一下搭建3个节点的alertmanager集群。 上方配置,来自 alertmanager在github上的配置。地址:https://githu…
alertmanager的使用
分组机制可以将某一类型的告警信息合并成一个大的告警信息,避免发送太多的告警邮件。 **比如:**我们有3台服务器都介入了Prometheus,这3台服务器同时宕机了,那么如果不分组可能会发送3个告警信息,如果分组了,那么会合并成一个大的告警信息。 监控服务器宕机的时间超过1分钟…
Prometheus之告警规则的编写
对于被Prometheus监控的服务器,我们都有一个up指标,可以知道该服务是否在线。 对于下线超过1分钟的服务,产生告警信息。 1、for 指定达到告警阈值之后,一致要持续多长时间,才发送告警数据。 2、labels中可以指定自定义的标签,如果定义的标签已经存在,则会被覆盖。…
PromQL的简单使用
在prometheus中存在各种时间序列数据,那么我们如何根据时间序列查询想要的数据呢?prometheus为我们提供了强大的PromQL,借助PromQL我们可以查询到自己想要的数据。 Instant vector(即时向量):一组时间序列,每个时间序列包含一个样本,所有样本…
Prometheus基于文件的服务发现
之前我们要监控的节点服务器的ip:port都是写死在static_configs中的,不便于维护。那么有没有一个自动发现的机制呢? Prometheus提供了好多自动发现的机制,此处简单的记录一下基于文件的服务发现机制。 服务发现的配置文件可以是 json或者yaml的格式。 …
Prometheus重新标记
我们知道prometheus是一个时间序列数据库。会周期性的从各个target上抓取数据。那么我们抓取回来的各种指标数据,我们有没有办法再次进行处理呢? 要实现上述功能,我们就需要对标签进行重新标记。 通过重新标记,我们可以控制、管理并标准化环境中的指标。 从上图中可知,我们有…
Prometheus的单机部署
Prometheus是最初在SoundCloud上构建的开源系统监视和警报工具包 。是一个时间序列数据库。 时间序列数据:即按相同时序(相同名称和标签),以时间维度存储的连续的数据集合。 在同一个指标名称上添加、删除、修改标签将会产生一个新的时间序列。如果我们为该时间系列配置了…