这是我参与「第五届青训营」伴学笔记创作活动的第10天。
一、微服务架构介绍
1、系统架构演变历史
为什么系统架构需要演进?
- 互联网的爆炸性发展
- 硬件设施的快速发展
- 需求复杂性的多样化
- 开发人员的急剧增加
- 计算机理论及技术的发展
微服务架构:彻底的服务化
优势:
- 开发效率
- 业务独立设计
- 自下而上
- 故障隔离
劣势:
- 治理、运维难度
- 观测挑战
- 安全性
- 分布式系统
2、微服务架构核心要素
- 服务治理
服务注册
服务发现
负载均衡
扩缩容
流量治理
稳定性治理
- 可观测性
日志采集
日志分析
监控打点
监控大盘
异常报警
链路追踪
- 安全
身份验证
认证授权
访问令牌
审计
传输加密
黑产攻击
二、微服务架构原理及特征
1、基本概念
服务:一组具有相同逻辑的运行实体。
实例:一个服务中,每个运行实体为一个实例。
实例与进程的关系:实例与进程之间没有必然对应关系,可以一个实例对应一个或多个进程。
集群:通常指服务内部的逻辑划分,包含多个实例。
常见的实例承载形式:进程、VM、k8s pod
有状态/无状态服务:服务的实例是否存储了可持久化的数据。
服务间通信:对于单体服务,不同模块通信只是简单的函数调用。对于微服务,服务间通信意味着网络传输。
2、服务注册及发现
在代码层面,如何指定调用一个目标服务的地址?
新增一个统一的服务注册中心,用于存储服务名到服务实例的映射。
3、流量特征
- 统一网关入口
- 内网通信多数采用RPC
- 网状调用链路
三、核心服务治理功能
1、服务发布
服务分布:指让一个服务升级运行新的代码的过程。
服务发布的难点:服务不可用、服务抖动、服务回滚。
蓝绿部署:简单稳定、但需要两倍资源。
2、流量治理
在微服务架构下,可以基于地区、集群、实例、请求等维度,对端到端流量的路由路径进行控制。
3、负载均衡
负载均衡负责分配请求在每个下游实例上的分布。
常见的LB策略:Round Robin、Random、Ring Hash、Least Request
4、稳定性治理
线上服务总会出问题,与程序的正确性无关。
- 网络攻击
- 流量突增
- 机房断电
- 光纤被挖
- 机器故障
- 网络故障
- 机房空调故障
微服务架构中典型的稳定性治理功能:限流、熔断、过载保护、降级
四、字节跳动服务治理实践
1、重试的意义
本地函数调用可能出现的异常
- 参数非法
- OOM(out of memory)
- NPE(null pointer exception)
- 边界case
- 系统崩溃
- 死循环
- 程序异常退出
远程函数调用可能出现的异常
- 网络抖动
- 下游负载高导致超时
- 下游机器宕机
- 本地机器负载高,调度超时
- 下游熔断、限流
重试可以避免偶发的错误,提高SLA(service level agreement)。
- 降低错误率
- 降低长尾延时
- 容忍暂时性错误
- 避开下游故障实例
2、重试的难点
幂等性
重试风暴
超时设置
3、重试策略
- 限制重试比例,设置一个重试比例阈值,重试次数占所有请求比例不超过该阈值。
- 防止链路重试,链路层面的防重试风暴的核心是限制每层都发生重试,理想情况下只有最下一层发生重试。
- Hedged requests,对于可能超时的请求,重新向另一个下游实例发送一个相同的请求,并等待先到达的响应。
4、重试效果验证
验证经过上述重试策略后,在链路上发生的重试放大效应。