首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
SRETALK
掘友等级
联合创始人
|
北京快猫星云科技有限公司
SRE、可观测性、稳定性治理、开源相关的话题
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
23天前
关注
Categraf 监控采集器常见问题汇总
总结一下社区常见的问题,供大家参考。不过在描述具体问题之前,请先了解 Categraf 的核心职能: 采集监控指标 在即时查询里可以看到机器各个指标的历史趋势图,就是 Ca...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
23天前
关注
SRE 踩坑记:JVM 暂停竟然是因为日志
在高性能计算领域,我们习惯于在代码、算法或基础设施中寻找瓶颈。但我遇到过的最棘手的问题却不在这些方面。那是Java虚拟机(JVM)的垃圾回收器与服务器磁盘之间一种无形的交互...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
2月前
关注
夜莺监控设计思考(五)告警原理和处理流程深度剖析
这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、...
2
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
2月前
关注
夜莺监控设计思考(四)关于机器那些事儿
这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
2月前
关注
夜莺监控设计思考(三)时序库、agent 的一些设计考量
这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
2月前
关注
夜莺监控设计思考(二)边缘机房架构思考
这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
2月前
关注
利用 OpenTelemetry 集成 JMX 监控
JMX 是什么? JMX 是 “Java Management Extensions” 的缩写,中文通常称为 “Java 管理扩展”。它是 Java 平台提供的一套标准框架...
1
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
2月前
关注
夜莺监控设计思考(一)整体定位、架构设计、单进程多进程选择、高可用设计
这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 整体定位 了解一个开源项目,最应该了解的就是其定位,或者说它要解决的问题域。 ...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
4月前
关注
夜莺监控新版表格配置图文讲解
夜莺监控从 8.3 版本开始引入了新版的表格,力争对齐 Grafana(Grafana 积累了多年,确实太强了),本文图文并茂手把手教你配置一个 Table 仪表盘出来,用...
1
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
4月前
关注
利用 OpenTelemetry 建设尾部采样
可观测性已成为维护系统健康和性能的关键要素。虽然传统的采样方法曾发挥过作用,但尾部采样的出现代表了我们处理追踪数据收集与分析方式的范式转变。这种智能采样策略正在彻底改变各组...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
4月前
关注
开源夜莺里如何引用标签和注解变量
今天遇到开源社区咨询:夜莺里如何引用标签和注解变量?这个问题如果通读文档,其实也能找到答案,不过相关知识是散落在各处的,这里就集中说一下,方便大家查阅。 哪里可以引用标签和...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
4月前
关注
Grafana侧重可视化,那多数据源告警呢?
在监控、可观测性领域,Grafana 应该是使用最为广泛的开源项目了,Grafana 可以对接多种数据源,对其中的数据做可视化分析。 实际上,Grafana 也可以配置告警...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
4月前
关注
可观测性体系建设五步心法:明业务、立规范、采数据、显特征、获洞见
笔者做监控 11 年,在可观测性领域创业 4 年,与各类客户沟通较多,发现很多企业想要建设可观测性体系,但是不得章法,我把整个建设过程做了一个简单总结,梳理一下其中的脉络,...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
4月前
关注
Prometheus 监控 Kubernetes Cluster 最新极简教程
Kubernetes 是在生产中运行容器化工作负载的最流行的编排器。它为您提供了一套完整的工具,用于部署、扩展和管理容器。 不过,仅靠 Kubernetes 不足以运维应用...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
4月前
关注
夜莺监控的几种架构模式详解
对于 IT 的稳定性保障,越来越受到重视,据国外数据统计,监控、可观测性相关的支出大概占总体 IT 支出的 5%~8% 左右。CNCF 作为知名基金会,旗下最有名的项目当属...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
4月前
关注
监控系统如何选型:Zabbix vs Prometheus
经常收到网友提问,监控系统选型,到底应该选择 Zabbix 还是 Prometheus?本文谈一下个人看法,希望对你有所启发。 时代决定了基因 Zabbix 是 2001 ...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
4月前
关注
夜莺开源监控,模板函数一览
本文介绍夜莺开源项目(Nightingale)的模板函数,夜莺内置了很多模板函数,可以对告警事件做一些渲染调整,方便 On-call 人员根据告警事件处理告警。 本文大纲:...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
4月前
关注
Prometheus 告警时为何无法获取现场值
Prometheus 生态已经成为新时代的监控标准,很多公司都用到了 Prometheus 生态的产品。在使用 Prometheus 过程中,经常有人困惑:为何在告警恢复时...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
5月前
关注
为 Prometheus 告警规则增加 UI 管理能力
Prometheus 体系貌似已经成为新时代的监控标准,运维出去找工作,很多公司都要求掌握 Prometheus 相关知识。 但是,Prometheus 实际在应用时,通常...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
5月前
关注
如何监控多个进程的存活和CPU、内存占用
对于很多偏传统的企业,尚未大规模应用 Kubernetes 技术,也没有为应用埋点,此时进程监控就很关键了。最典型的需求就是监控进程的存活性和进程的资源(CPU、内存等)占...
0
评论
分享
下一页
个人成就
文章被点赞
22
文章被阅读
19,316
掘力值
1,543
关注了
1
关注者
16
收藏集
1
关注标签
7
加入于
2022-06-22