这是我参与「第五届青训营」伴学笔记创作活动的第 12 天

核心服务治理功能

服务发布（deployment)

定义： 即指让一个服务升级运行新的代码的过程。

难点： 很多服务都是在线的，不能在修改的时候停止服务，要思考三个问题：1.不能服务停止。2.服务抖动怎么办。3。万一服务升级出现错误怎么回滚。

方案一：

蓝绿部署：一个服务中换分成两个cluster，一个断开并升级，完成后重连再升级另一个cluster中的instance。

特点：简单、稳定，但是需要两倍资源。

方案二：灰度发布（也称金丝雀发布）

特点：需要精细化切分、回滚很繁琐。

可以基于地区、集群、实例（不同实例部署的机器的新老程度）、请求等维度，对端到端的流量的路由路径进行加权选择。如图。

定义： 负责分配请求在每个下游实例上的分布。

线上服务总会出问题，这与程序的正确性无关。

治理方法

对于本地的函数调用，认为是没有什么重试的意义的。对于远程网络函数调用，重试可以避免偶发的错误，提高SLA（Service-Level Agreeme）

重试风暴