首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
SRE
SRETALK
创建于2024-09-06
订阅专栏
SRE 相关话题
暂无订阅
共6篇文章
创建于2024-09-06
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
可观测性体系建设五步心法:明业务、立规范、采数据、显特征、获洞见
笔者做监控 11 年,在可观测性领域创业 4 年,与各类客户沟通较多,发现很多企业想要建设可观测性体系,但是不得章法,我把整个建设过程做了一个简单总结,梳理一下其中的脉络,希望对你有所启发。 整个可观
Kafka 不难,只是你用得不对
本文分享使用 Kafka 的一些经典模式。有时你感觉 Kafka 好难搞,可能是因为不了解这些模式。 让我们从基础开始: 1.每个事件类型一个主题 反模式: 每个服务都有自己的主题?不不不,你要这么搞
运维想转SRE?先了解这7个原则
站点可靠性工程,或 SRE,是一种将运维问题视为软件问题的方法。这一概念最初由 Google 工程师 Ben Treynor Sloss 在 2003 年提出并描述。作为一门学科,站点可靠性工程(SR
顶级流媒体服务商 Spotify 2025.04 故障复盘报告,吃他人的堑长自己的智
2025 年 4 月 16 日,Spotify 经历了一次影响全球用户的中断。以下就是发生了什么以及我们将如何解决它。 背景 我们使用 Envoy Proxy 作为我们的网络外围系统。外围是我们的软件
AI 和可观测性到底如何整合?
这一波 AI 浪潮跟以往都不同,各个行业都看到了新的可能性,都想把 AI 引入自己的场景,看看能迸发什么样的助力。笔者所在的监控、可观测性领域,也有各种尝试,比如: 通过 AI 翻译人类语言生成 SQ
运维的价值为何经常被挑战?哪些工作更有价值?
今天聊一下这个很让人扫兴的问题。刷进来的人,大概率至少是总监以上角色,或者有追求、善于思考的运维人员。握个手,幸会。 谁来回答这个问题 普通运维工程师无需回答,因为这是 CTO 最应该回答的问题。CT