首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
SRETALK
掘友等级
联合创始人
|
北京快猫星云科技有限公司
SRE、可观测性、稳定性治理、开源相关的话题
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
9月前
关注
从仪表盘探索 MongoDB 关键指标
这是 MongoDB 监控系列文章的第七篇,探索 MongoDB 的监控指标,作为新手,我们从 Grafana 的仪表盘着手,通常写到仪表盘中的指标都是相对重要的指标...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
9月前
关注
夜莺短信告警教程
夜莺监控(Nightingale)已经内置支持了邮件、钉钉、飞书、企微等多种通知机制,本文讲解如何对接短信通道...
1
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
9月前
关注
夜莺 v7 最终版来了,可以上车了
夜莺监控 Nightingale 发布了 v7.7 版本,这是 v7 系列的最后一个版本,保守主义者可以放心上车了。...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
10月前
关注
Zabbix 和 Prometheus 选型对比
Zabbix 和 Prometheus 无疑是开源监控领域最厉害的两个扛把子,在企业落地选型时应该如何做选择呢?本文尝试从数据采集、告警、可视化、事件分发等多个方面做一个对...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
10月前
关注
手把手教程:使用 Fluentbit 采集夜莺日志写入 ElasticSearch
Fluentbit 是非常流行的日志采集器,作为 Fluentd 的子项目,是 CNCF 主推的项目,本文以夜莺的日志举例,使用 Fluentbit 采集,并直接写入 El...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
10月前
关注
VictoriaMetrics 中文教程(10)集群版介绍
VictoriaMetrics 中文教程系列文章第十篇,介绍 VictoriaMetrics 集群版...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
11月前
关注
夜莺监控的机器支持挂载到多个业务组了
夜莺开源项目于国庆前夕发布了 v7.4.1 版本,修复了一些 bug,同时也带来了一些新功能。其中最重要的一个功能是:机器支持挂载到多个业务组了。本文将介绍几个重要的变更。...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
12月前
关注
Datadog 监控最佳实践 | 收集正确的数据
本文是Datadog“高效监控”系列的第一篇,讲解监控落地的方法论,Datadog作为最头部的可观测性厂商,其产出的方法论值得非常阅读...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1年前
关注
服务稳定性保障的五大误解
误解一:服务可用性 听过很多技术分享,看过很多平台的承诺,上来都是讲我们的服务稳定性99.9xx%,但似乎都“忘记”了提供这个稳定性的具体算法和解读。如果没有明确的定义,这...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1年前
关注
企业分享 - 益丰大药房监控升级之路
益丰有体量庞大的研发运维团队,有体量庞大的 IT 设施和服务,为了能够更好的监控这些设施和服务,益丰在多年前就开始建设监控系统,本文分享益丰的监控升级之路,来自益丰的运维团...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1年前
关注
无需推翻既有的建设,这个可观测性产品思路清奇
市面上已经有很多开源、商业的可观测性类产品,比如 Zabbix、Prometheus、Nightingale、SigNoz、SkyWalking、ELK 等等,而且各类云厂...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1年前
关注
海大集团的可观测平台建设实践
海大集团介绍 海大集团是以科技为主导的中国农业龙头企业,1998年成立于广东广州,目前业务涵盖饲料、种苗、动保疫苗、智慧养殖、食品加工等现代农牧全产业链,在全球拥有分子公司...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1年前
关注
Prometheus 告警恢复时,怎么获取恢复时的值?
Prometheus 告警事件中的 $value 表示当前告警触发时的值,但是在告警恢复时,Resolved 事件中的 $value 仍然是最新告警时的值,并非是恢复时的值...
1
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1年前
关注
关于告警,要想做好,从这些方面着手
各类监控系统都会产生告警事件,于是,就产生了 FlashDuty、PagerDuty、Opsgenie 这类产品,做告警事件的收敛降噪、排班认领升级等。如果你想增强自己公司...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1年前
关注
SRE 必备知识 - Kafka 探秘之零拷贝技术
如果你了解过 Kafka,那么它用到的一个性能优化技术可能会引起你的注意 -- 操作系统的零拷贝(zero-copy)优化。 在 Kafka 的场景下,操作系统可以从 pa...
1
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1年前
关注
使用 SpanMetrics Connector 将 OpenTelemetry 跟踪转换为指标
在 OpenTelemetry 中,如何利用链路追踪的数据生成指标,本文介绍 SpanMetrics Connector 的方案...
1
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1年前
关注
9k star 监控系统,100% 国产,推荐了解
前言 监控系统的重要性不言而喻,国内用的最多的应该是 Zabbix 和 Prometheus,其优缺点: Zabbix 是资产管理式,监控数据存在数据库中,擅长设备监控,不...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1年前
关注
可观测性与传统监控的区别和联系
什么是可观测性? 可观测性(Observability)是一种软件开发和系统构建的哲学,是对系统内部状态及行为的度量和推断能力,通常包括日志、指标、链路追踪等多个度量维度。...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
1年前
关注
Kubernetes 中必备的 10 个告警处置方法
运行 Kubernetes 集群,显然不止是启动,还需要持续监控,以确保 Kubernetes 中的服务能正常运行。 不过,您不想整天盯着一堆 Kubernetes 仪表板...
0
评论
分享
下一页
个人成就
文章被点赞
17
文章被阅读
13,709
掘力值
1,360
关注了
1
关注者
14
收藏集
1
关注标签
7
加入于
2022-06-22