微服务架构原理与治理实践 | ByteTech笔记

星辰落入海

2023-06-17 223 阅读3分钟

01 微服务架构介绍

演变历史

单体 - 垂直应用- 分布式 - SOA - 微服务

微服务架构

微服务架构核心要素

02 微服务架构原理及特征

服务
- 一组具有相同逻辑的运行实体
实例
- 一个服务中，每个运行实体即为一个实例
实例与进程的关系
- 实例与进程没有必然对应关系，可以一个实例对应一个或多个进程
集群
- 通常指服务内部的逻辑划分，包含多个实例
常见的实例承载形式
- 进程、VM、k8s pod...
有状态/无状态服务
- 服务的实例是否存储了可持久化的数据（例如磁盘文件）

2.1 基本概念

服务间通信

2.2 服务注册及发现

硬编码
DNS
- 问题：本地DNS缓存延时；负载均衡问题；不支持服务实例的探活检查；域名无法配置端口
服务注册中心
- 思路：新增一个统一的服务注册中心，用于存储服务名到服务实例的映射

2.3 流量特征

统一网关入口
内网通信多数采用RPC
网状调用链路

03 核心服务治理功能

3.1 服务发布

难点

服务不可用
服务抖动
服务回滚

方式

蓝绿部署
灰度发布（金丝雀发布）

3.2 流量治理

在微服务架构下，我们可以基于地区、集群、实例、请求等维度，对端到端流量的路由路径进行精确控制。

3.3 负载均衡

常见策略

Round Robin
Random
Ring Hash
Least Request

3.4 稳定性治理

限流
熔断
过载保护
降级

04 字节跳动服务治理实践

4.1 重试的意义

降低错误率
- 假设单次请求的错误概率为 0.01，那么连续两次错误概率则为 0.0001.
降低长尾延时
- 对于偶尔耗时较长的请求，重试请求有机会提前返回
容忍暂时性错误
- 某些时候系统会有暂时性异常 (例如网络抖动)，重试可以尽量规避
避开下游故障实例
- 一个服务中可能会有少量实例故障 (例如机器故障)重试其他实例可以成功。

4.2 重试的难点

重试的难点

幂等性
- 多次请求可能数据不一致
重试风暴
- 随着调用深度增加，重试次数会指数级上涨
超时设置
- 假设一个调用正常是1s的超时时间，如果允许一次重试，那么第一次请求经过多少时间时，才开始重试呢？

4.3 重试策略

限制重试比例
- 设定重试阈值（比如1%）
防止链路重试
- 限制每层都发生重试，理想情况下只有最下一层发生重试
- 可以返回特殊的status表明“请求失败，但别重试”
Hedged requests
- 对于可能超时（或延时高）的请求，重新向另一个下游实例发送相同请求，并等待先到达的响应

4.4 重试效果验证

实际验证经过上述重试策略后，在链路上发生的重试放大效应