读后感:《SRE:Google 运维解密》

14 阅读1分钟

这本书中文的翻译很像是讲运维的,但是其实是讲 Google 是如何保障站点的可靠性的,Google 拥有很多四十亿级别用户的产品,如何保障这么大用户量产品可靠性需要作为一个学科去研究,这本书就是 Google 的 SRE 这么多年总结的一些经验,作为书籍,非常的系统,但是又因为是每个工程师根据过去的经验列举的各种的 bad case 和各种内部工具,看起来又非常的零散,虽然每个人的行文风格不一样,但是非常具有参考价值,非常的全面,尤其是里面是怎么做事故记录和复盘的方法论和文档,我已经用在自己的工作中了,很好用。

这本书中有一章节给我印象非常的深刻:乏味是一种美德。“与侦探小说不同,缺少刺激、悬念和困惑是源代码的理想特性”,为了解决一个问题,所要面临的必要的复杂度是无法避免的,比如访问有瓶颈需要引入 CDN 加速访问,但是为了一些还没有到来的问题提前引入的复杂度就很有可能会造成意外,比如提前进行 GC 调优,提前引入分布式架构。