首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
SRETALK
掘友等级
联合创始人
|
北京快猫星云科技有限公司
SRE、可观测性、稳定性治理、开源相关的话题
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
11天前
关注
夜莺监控新版表格配置图文讲解
夜莺监控从 8.3 版本开始引入了新版的表格,力争对齐 Grafana(Grafana 积累了多年,确实太强了),本文图文并茂手把手教你配置一个 Table 仪表盘出来,用...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
17天前
关注
利用 OpenTelemetry 建设尾部采样
可观测性已成为维护系统健康和性能的关键要素。虽然传统的采样方法曾发挥过作用,但尾部采样的出现代表了我们处理追踪数据收集与分析方式的范式转变。这种智能采样策略正在彻底改变各组...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
18天前
关注
开源夜莺里如何引用标签和注解变量
今天遇到开源社区咨询:夜莺里如何引用标签和注解变量?这个问题如果通读文档,其实也能找到答案,不过相关知识是散落在各处的,这里就集中说一下,方便大家查阅。 哪里可以引用标签和...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
22天前
关注
Grafana侧重可视化,那多数据源告警呢?
在监控、可观测性领域,Grafana 应该是使用最为广泛的开源项目了,Grafana 可以对接多种数据源,对其中的数据做可视化分析。 实际上,Grafana 也可以配置告警...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
25天前
关注
可观测性体系建设五步心法:明业务、立规范、采数据、显特征、获洞见
笔者做监控 11 年,在可观测性领域创业 4 年,与各类客户沟通较多,发现很多企业想要建设可观测性体系,但是不得章法,我把整个建设过程做了一个简单总结,梳理一下其中的脉络,...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
28天前
关注
Prometheus 监控 Kubernetes Cluster 最新极简教程
Kubernetes 是在生产中运行容器化工作负载的最流行的编排器。它为您提供了一套完整的工具,用于部署、扩展和管理容器。 不过,仅靠 Kubernetes 不足以运维应用...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
28天前
关注
夜莺监控的几种架构模式详解
对于 IT 的稳定性保障,越来越受到重视,据国外数据统计,监控、可观测性相关的支出大概占总体 IT 支出的 5%~8% 左右。CNCF 作为知名基金会,旗下最有名的项目当属...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1月前
关注
监控系统如何选型:Zabbix vs Prometheus
经常收到网友提问,监控系统选型,到底应该选择 Zabbix 还是 Prometheus?本文谈一下个人看法,希望对你有所启发。 时代决定了基因 Zabbix 是 2001 ...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1月前
关注
夜莺开源监控,模板函数一览
本文介绍夜莺开源项目(Nightingale)的模板函数,夜莺内置了很多模板函数,可以对告警事件做一些渲染调整,方便 On-call 人员根据告警事件处理告警。 本文大纲:...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1月前
关注
Prometheus 告警时为何无法获取现场值
Prometheus 生态已经成为新时代的监控标准,很多公司都用到了 Prometheus 生态的产品。在使用 Prometheus 过程中,经常有人困惑:为何在告警恢复时...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1月前
关注
为 Prometheus 告警规则增加 UI 管理能力
Prometheus 体系貌似已经成为新时代的监控标准,运维出去找工作,很多公司都要求掌握 Prometheus 相关知识。 但是,Prometheus 实际在应用时,通常...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1月前
关注
如何监控多个进程的存活和CPU、内存占用
对于很多偏传统的企业,尚未大规模应用 Kubernetes 技术,也没有为应用埋点,此时进程监控就很关键了。最典型的需求就是监控进程的存活性和进程的资源(CPU、内存等)占...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1月前
关注
Kafka 不难,只是你用得不对
本文分享使用 Kafka 的一些经典模式。有时你感觉 Kafka 好难搞,可能是因为不了解这些模式。 让我们从基础开始: 1.每个事件类型一个主题 反模式: 每个服务都有自...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1月前
关注
底层的告警,上层业务应该收吗?
有朋友问:我是业务应用的 DEV 或 SRE,我的应用依赖了底层服务和基础设施,比如依赖基础网络、Kubernetes、MySQL、收银台服务,那这些基础服务如果出问题,我...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1月前
关注
CPU 负载高,到底应不应该告警?
CPU 负载高,到底应不应该告警? 不告警吧,出了问题怕被怼,嫌你告警缺失 告警吧,好像全是噪音,工程师都自动忽略了 尴尬… 成年人的世界没有非黑即白,如果要严肃的论述,就...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
2月前
关注
夜莺监控 V8 正式版,来了!
今天在北京举办了 第三届CCF·夜莺开源创新论坛 的线下大会,正式发布夜莺 V8 版本,一直在等待正式版再上生产的小伙伴们,可以升级啦! 先给大家贴几张照片,感受一下大会的...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
2月前
关注
夜莺监控V8发版,内置支持 DeepSeek 对接
夜莺监控发布了 v8.beta14 版本,新增 Postgres 告警支持和 AI Summary 处理器(无缝集成 ChatGPT 和 DeepSeek 等),增强业务监...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
3月前
关注
开源夜莺支持MySQL数据源,更方便做业务指标监控了
夜莺监控项目最核心的定位,是做一个告警引擎,支持多种数据源的告警。这个版本的更新主要是增加了对 MySQL 数据源的支持,进一步增强了夜莺在业务指标监控方面的能力。 之前版...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
3月前
关注
开源夜莺V8.Beta11发版,支持CK告警、事件Pipeline等
这个版本来得迟了一些,主要是新功能加的多,下面简单介绍一下新功能,下下周也计划做一次直播讲解。 支持 ClickHouse 告警 夜莺最重要的定位是告警引擎,所以会持续增加...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
3月前
关注
运维想转SRE?先了解这7个原则
站点可靠性工程,或 SRE,是一种将运维问题视为软件问题的方法。这一概念最初由 Google 工程师 Ben Treynor Sloss 在 2003 年提出并描述。作为一...
0
评论
分享
下一页
个人成就
文章被点赞
17
文章被阅读
13,704
掘力值
1,360
关注了
1
关注者
14
收藏集
1
关注标签
7
加入于
2022-06-22