首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
青牛踏雪御苍穹
掘友等级
SRE
读书,游泳,爬山
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
Prometheus监控神器-服务发现篇(一)
手动添加主机IP和端口,然后重载服务让Prometheus发现。 对于一组比较少的服务器的测试环境中,这种手动方式添加配置信息是最简单的方法。但是实际生产环境中,对于成百上千的节点组成的大型集群又或者Kubernetes这样的大型集群,很明显,手动方式捉襟见肘了。 为此,Pro…
Prometheus监控神器-Alertmanager篇(4)
为了提升Prometheus的服务可靠性,我们会部署两个或多个的Prometheus服务,两个Prometheus具有相同的配置(Job配、告警规则、等),当其中一个Down掉了以后,可以保证Prometheus持续可用。 AlertManager自带警报分组机制,即使不同的P…
Prometheus监控神器-Alertmanager篇(3)
静默 Silences 是指让通过设置让警报在指定时间暂时不会发送警报的一种方式。通常静默一般用于解决严重生产故障问题时,因所花费的时间过长,通过静默设置避免接收到过多的无用通知。在已知的例行维护中,为了防止对例行维护的机器发送不必要的警报,可以在 维护期间设置一个时间范围,临…
Prometheus监控神器-Rules篇
Prometheus把产生的警报发给Alertmanager进行处理时,需要在Prometheus使用的配置文件中添加关联Alertmanager的组件的对应配置信息。 上面的配置中的 alert_relabel_configs是指警报重新标记在发送到Alertmanager之…
Prometheus监控神器-Alertmanager篇(2)
前面一直是在Web UI 查看警报信息,现在开始使用接收器与Alertmanager集成,发送警报信息到 Email、企业微信、钉钉机器人,对于警报要求比较高的同学,可以根据下面提到的开源组件 【PrometheusAlert全家桶】 配置飞书、短信、语音电话等警报。 前面已经…
Prometheus监控神器-Alertmanager篇(1)
警报一直是整个监控系统中的重要组成部分,Prometheus监控系统中,采集与警报是分离的。 Alertmanager ,经过 Alertmanager r对警报的信息处理后,最终通过接收器发送给指定用户,另外在 Alertmanager 中没有通知组的概念,只能自己对软件重新…
Prometheus监控Docker Swarm集群(一)
为了解决容器的监控问题,Google开发了一款容器监控工具cAdvisor(Container Advisor),它为容器用户提供了对其运行容器的资源使用和性能特征的直观展示。 它是一个运行守护程序,用于收集,聚合,处理和导出有关正在运行的容器的信息。 cAdvisor可以对节…
个人成就
文章被点赞
8
文章被阅读
12,621
掘力值
349
关注了
21
关注者
16
收藏集
0
关注标签
42
加入于
2019-10-10