微服务架构原理与治理实践 | ByteTech笔记

223 阅读3分钟

01 微服务架构介绍

演变历史

单体 - 垂直应用- 分布式 - SOA - 微服务

微服务架构 image.png

微服务架构核心要素

image.png

02 微服务架构原理及特征

  • 服务
    • 一组具有相同逻辑的运行实体
  • 实例
    • 一个服务中,每个运行实体即为一个实例
  • 实例与进程的关系
    • 实例与进程没有必然对应关系,可以一个实例对应一个或多个进程
  • 集群
    • 通常指服务内部的逻辑划分,包含多个实例
  • 常见的实例承载形式
    • 进程、VM、k8s pod...
  • 有状态/无状态服务
    • 服务的实例是否存储了可持久化的数据(例如磁盘文件)

2.1 基本概念

服务间通信

image.png

2.2 服务注册及发现

  • 硬编码
  • DNS
    • 问题:本地DNS缓存延时;负载均衡问题;不支持服务实例的探活检查;域名无法配置端口
  • 服务注册中心
    • 思路:新增一个统一的服务注册中心,用于存储服务名到服务实例的映射

2.3 流量特征

  • 统一网关入口
  • 内网通信多数采用RPC
  • 网状调用链路

03 核心服务治理功能

3.1 服务发布

难点

  • 服务不可用
  • 服务抖动
  • 服务回滚

方式

  • 蓝绿部署
  • 灰度发布(金丝雀发布)

3.2 流量治理

在微服务架构下,我们可以基于地区、集群、实例、请求等维度,对端到端流量的路由路径进行精确控制。

image.png

3.3 负载均衡

常见策略

  • Round Robin
  • Random
  • Ring Hash
  • Least Request

3.4 稳定性治理

  • 限流
  • 熔断
  • 过载保护
  • 降级

image.png

04 字节跳动服务治理实践

4.1 重试的意义

  • 降低错误率
    • 假设单次请求的错误概率为 0.01,那么连续两次错误概率则为 0.0001.
  • 降低长尾延时
    • 对于偶尔耗时较长的请求,重试请求有机会提前返回
  • 容忍暂时性错误
    • 某些时候系统会有暂时性异常 (例如网络抖动),重试可以尽量规避
  • 避开下游故障实例
    • 一个服务中可能会有少量实例故障 (例如机器故障)重试其他实例可以成功。

4.2 重试的难点

重试的难点

  • 幂等性
    • 多次请求可能数据不一致
  • 重试风暴
    • 随着调用深度增加,重试次数会指数级上涨
  • 超时设置
    • 假设一个调用正常是1s的超时时间,如果允许一次重试,那么第一次请求经过多少时间时,才开始重试呢?

4.3 重试策略

  • 限制重试比例
    • 设定重试阈值(比如1%)
  • 防止链路重试
    • 限制每层都发生重试,理想情况下只有最下一层发生重试
    • 可以返回特殊的status表明“请求失败,但别重试”
  • Hedged requests
    • 对于可能超时(或延时高)的请求,重新向另一个下游实例发送相同请求,并等待先到达的响应

4.4 重试效果验证

实际验证经过上述重试策略后,在链路上发生的重试放大效应

image.png