可用性治理的三个关键要点

47 阅读1分钟

如果把事故比作火灾,那么技术 Leader 日常工作的核心就是围绕系统的风险隐患,建立“防火墙”。

变更需要监控

在推进监控落地的过程中,你要和团队成员讲明监控的重要性,还要确保监控的完善与有效,而针对某个业务场景,有效的监控要回答三个问题:

是否有问题发生?

哪里发生了问题?

发生了什么问题?

有效灰度必须有耐心

一些技术 Leader 认为“灰度就是在生产环境进行小范围测试”,就算嘴上不这么说,心里也这么想。但这个认知是绝对错误的,灰度从来不是为了测试,也不等于 A/B Test。它本身是为了对抗“未知的不确定性”。

回滚就是变更的“后悔药”

故障恢复最好的手段是各种预案,而回滚则是预案中最普遍、也最有效的。回滚这件事儿,你并不陌生,我重点想强调“何时回滚”以及“如何确保能回滚”。 此文章为9月Day22学习笔记,内容来源于极客时间《重学前端》,强烈推荐该课程