Prometheus

Prometheus

Prometheus

Prometheus数据监控

暂无订阅共11篇文章创建于2021-05-10

blackbox_exporter的使用

有些时候，我们想监听服务器的某个端口是否存在，监听http的请求是否正确时，这个时候就可以使用 blackbox_exporter来实现。 blackbox exporter 可以实现对 http，https，tcp(可以实现服务器接口是否在线)，icmp(实现主机探活)，dn…

5年前
1.1k
点赞
评论

SpringBoot整合Prometheus

实现SpringBoot和Prometheus的一个简单整合。 1、启用prometheus端点。 2、给每个指标指定一个通用的标签，application见下方的截图。 3、指定管理的端口和路径。可以看到里面存在一个 process_files_open_files 指标，…

5年前
1.7k
1
评论

sql_exporter的使用

有些时候，我们想看每天系统的登录人数、或者系统中订单的数据，比如：成功的订单、异常的订单等等。这些数据都在我们的数据库中，通过sql_exporter我们可以将这些数据接入到prometheus中，进行监控告警。 2、every_day_order_cnt {user_name…

5年前
545
点赞
评论

mysqld_exporter监控mysql信息

使用 mysqld_exporter 来抓取 mysql的一些指标信息。在创建用户的时候，推荐执行 MAX_USER_CONNECTIONS参数，避免我们监控使用过多的数据库连接数，导致数据库压力过大。在和mysqld_exporter文件同级的文件夹中创建my.cnf文件…

5年前
1.8k
点赞
评论

AlertManager集群搭建

单节点的告警管理器，如果宕机了，那么所有的告警信息都发送不出去，还是比较危险的，因此我们需要搭建一个高可用的告警管理器。此处，记录一下搭建3个节点的alertmanager集群。上方配置，来自 alertmanager在github上的配置。地址：https://githu…

5年前
414
点赞
评论

alertmanager的使用

分组机制可以将某一类型的告警信息合并成一个大的告警信息，避免发送太多的告警邮件。 **比如：**我们有3台服务器都介入了Prometheus，这3台服务器同时宕机了，那么如果不分组可能会发送3个告警信息，如果分组了，那么会合并成一个大的告警信息。监控服务器宕机的时间超过1分钟…

5年前
2.4k
4
2

Prometheus之告警规则的编写

对于被Prometheus监控的服务器，我们都有一个up指标，可以知道该服务是否在线。对于下线超过1分钟的服务，产生告警信息。 1、for 指定达到告警阈值之后，一致要持续多长时间，才发送告警数据。 2、labels中可以指定自定义的标签，如果定义的标签已经存在，则会被覆盖。…

5年前
828
3
评论

PromQL的简单使用

在prometheus中存在各种时间序列数据，那么我们如何根据时间序列查询想要的数据呢？prometheus为我们提供了强大的PromQL，借助PromQL我们可以查询到自己想要的数据。 Instant vector(即时向量)：一组时间序列，每个时间序列包含一个样本，所有样本…

5年前
466
点赞
评论

Prometheus基于文件的服务发现

之前我们要监控的节点服务器的ip:port都是写死在static_configs中的，不便于维护。那么有没有一个自动发现的机制呢? Prometheus提供了好多自动发现的机制，此处简单的记录一下基于文件的服务发现机制。服务发现的配置文件可以是 json或者yaml的格式。 …

5年前
616
点赞
1

Prometheus重新标记

我们知道prometheus是一个时间序列数据库。会周期性的从各个target上抓取数据。那么我们抓取回来的各种指标数据，我们有没有办法再次进行处理呢？要实现上述功能，我们就需要对标签进行重新标记。通过重新标记，我们可以控制、管理并标准化环境中的指标。从上图中可知，我们有…

5年前
1.7k
3
评论

Prometheus的单机部署

Prometheus是最初在SoundCloud上构建的开源系统监视和警报工具包。是一个时间序列数据库。时间序列数据：即按相同时序(相同名称和标签)，以时间维度存储的连续的数据集合。在同一个指标名称上添加、删除、修改标签将会产生一个新的时间序列。如果我们为该时间系列配置了…

5年前
1.6k
7
评论