-
前言
- 真正的大型后台系统,最难的不是开发
- 是安全上线 + 可控回滚
- 灰度发布是 SRE / 后端工程体系中必须具备的一环
-
灰度能力的演进路径
- 单服务灰度
- 多服务灰度
- 全链路灰度(含 MQ、CACHE、DB)
-
灰度维度
- 按用户灰度
- 按租户/企业灰度
- 按流量比例灰度
- 按地区灰度
- 按特征策略灰度(实验平台)
-
核心技术点
- 灰度路由
- 多版本服务注册发现
- 灰度流量标记(HTTP header / traceId)
- 灰度数据隔离(双表 / 双写 / 双 index)
-
回滚设计
- 回滚不是 git revert
- 回滚必须是可预测可自动
- 回滚策略矩阵:前端回滚、后端回滚、DB回滚、策略回滚
-
实战案例:订单系统灰度上线
- 订单新支付流程 rollout
- 数据对账
- 全链路 trace 验证
- 自动回滚阈值报警
-
总结
- 灰度并不是“高级操作”
- 它是成熟后端工程团队的基本交付能力