首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
SRETALK
掘友等级
联合创始人
|
北京快猫星云科技有限公司
SRE、可观测性、稳定性治理、开源相关的话题
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
4月前
关注
手把手教程:使用 Fluentbit 采集夜莺日志写入 ElasticSearch
Fluentbit 是非常流行的日志采集器,作为 Fluentd 的子项目,是 CNCF 主推的项目,本文以夜莺的日志举例,使用 Fluentbit 采集,并直接写入 El...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
5月前
关注
VictoriaMetrics 中文教程(10)集群版介绍
VictoriaMetrics 中文教程系列文章第十篇,介绍 VictoriaMetrics 集群版...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
5月前
关注
夜莺监控的机器支持挂载到多个业务组了
夜莺开源项目于国庆前夕发布了 v7.4.1 版本,修复了一些 bug,同时也带来了一些新功能。其中最重要的一个功能是:机器支持挂载到多个业务组了。本文将介绍几个重要的变更。...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
6月前
关注
Datadog 监控最佳实践 | 收集正确的数据
本文是Datadog“高效监控”系列的第一篇,讲解监控落地的方法论,Datadog作为最头部的可观测性厂商,其产出的方法论值得非常阅读...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
6月前
关注
服务稳定性保障的五大误解
误解一:服务可用性 听过很多技术分享,看过很多平台的承诺,上来都是讲我们的服务稳定性99.9xx%,但似乎都“忘记”了提供这个稳定性的具体算法和解读。如果没有明确的定义,这...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
企业分享 - 益丰大药房监控升级之路
益丰有体量庞大的研发运维团队,有体量庞大的 IT 设施和服务,为了能够更好的监控这些设施和服务,益丰在多年前就开始建设监控系统,本文分享益丰的监控升级之路,来自益丰的运维团...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
无需推翻既有的建设,这个可观测性产品思路清奇
市面上已经有很多开源、商业的可观测性类产品,比如 Zabbix、Prometheus、Nightingale、SigNoz、SkyWalking、ELK 等等,而且各类云厂...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
海大集团的可观测平台建设实践
海大集团介绍 海大集团是以科技为主导的中国农业龙头企业,1998年成立于广东广州,目前业务涵盖饲料、种苗、动保疫苗、智慧养殖、食品加工等现代农牧全产业链,在全球拥有分子公司...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
Prometheus 告警恢复时,怎么获取恢复时的值?
Prometheus 告警事件中的 $value 表示当前告警触发时的值,但是在告警恢复时,Resolved 事件中的 $value 仍然是最新告警时的值,并非是恢复时的值...
1
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
关于告警,要想做好,从这些方面着手
各类监控系统都会产生告警事件,于是,就产生了 FlashDuty、PagerDuty、Opsgenie 这类产品,做告警事件的收敛降噪、排班认领升级等。如果你想增强自己公司...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
SRE 必备知识 - Kafka 探秘之零拷贝技术
如果你了解过 Kafka,那么它用到的一个性能优化技术可能会引起你的注意 -- 操作系统的零拷贝(zero-copy)优化。 在 Kafka 的场景下,操作系统可以从 pa...
1
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
使用 SpanMetrics Connector 将 OpenTelemetry 跟踪转换为指标
在 OpenTelemetry 中,如何利用链路追踪的数据生成指标,本文介绍 SpanMetrics Connector 的方案...
1
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
9k star 监控系统,100% 国产,推荐了解
前言 监控系统的重要性不言而喻,国内用的最多的应该是 Zabbix 和 Prometheus,其优缺点: Zabbix 是资产管理式,监控数据存在数据库中,擅长设备监控,不...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
可观测性与传统监控的区别和联系
什么是可观测性? 可观测性(Observability)是一种软件开发和系统构建的哲学,是对系统内部状态及行为的度量和推断能力,通常包括日志、指标、链路追踪等多个度量维度。...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
Kubernetes 中必备的 10 个告警处置方法
运行 Kubernetes 集群,显然不止是启动,还需要持续监控,以确保 Kubernetes 中的服务能正常运行。 不过,您不想整天盯着一堆 Kubernetes 仪表板...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
2024 年了,IT 运维监控系统都有哪些推荐?
大浪淘沙,2024 年的今天,市面上很多监控系统慢慢淡出了大家的视野,而一些新的监控系统也逐渐崭露头角。今天我们就来看看 2024 年的当下,哪些 IT 运维监控系统最值得...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
运维 + AI,你得先搞懂这些
很感谢夜莺提供如此优质的平台能和行业内顶尖技术大佬做面对面的交流,在这个会议中又学习到了很多有趣有深度的内容,给我在未来探索的道路上提供了一些新的指引方向。同时感谢夜莺社区...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
7月前
关注
在 Kubernetes 中部署 Alertmanager
AlertManager 是一个开源警报系统,与 Prometheus 监控系统配合使用。本博客是 Prometheus Kubernetes 教程系列的一部分。在我们之前...
0
评论
分享
SRETALK
联合创始人 @北京快猫星云科技有限公司
·
8月前
关注
Grafana Loki 架构组件详解,比 ES 成本低很多
在本指南中,我们将详细了解Grafana Loki架构及其组件。 在公司的分布式环境中,存储和管理来自各种系统资源的日志是一项具有挑战性的任务。为了简化这项任务,引入了一个...
1
评论
分享
下一页
个人成就
文章被点赞
17
文章被阅读
8,845
掘力值
952
关注了
1
关注者
11
收藏集
1
关注标签
7
加入于
2022-06-22