这是我参与「第五届青训营」伴学笔记创作活动的第 12 天,今天学习的内容是关于RPC框架的基本概念、分层设计、核心指标与实践分享,根据课程内容整理学习笔记如下。
10 RPC原理与实现
10.1 基本概念
10.1.1 需要解决的问题
相比本地函数调用,RPC (Remote Procedure Calls 远程函数调用) 调用需要解决的问题
- 函数映射
- 数据转换成字节流
- 网络传输
10.1.2 RPC概念模型
10.1.3 一次 RPC 的完整过程
- IDL (Interface description language) 文件: IDL通过一种中立的方式来描述接口,使得在不同平台上运行的对象和用不同语言编写的程序可以互相通信
- 生成代码: 通过编译器工具把IDL文件转换成语言对应的静态库
- 编解码: 从内存中表示到字节序列的转换称为编码,反之为解码,也常叫做序列化和反序列化
- 通信协议: 规范了数据在网络中的传输内容和格式,除必须的请求/响应数据外,通常还会包含额外的元数据
- 网络传输: 通常基于成熟的网络库走TCP/UDP传输
10.1.4 RPC的好处
- 单一职责,有利于分工协作和运维开发
- 可扩展性强,资源利用率更优
- 故障隔离,服务的整体可靠性更高
10.1.5 RPC带来的问题
- 服务宕机如何感知?
- 遇到网络异常应该如何应对?
- 请求量暴增怎么处理?
A:将由 RPC 框架来解决
10.2 RPC 框架分层设计
10.2.1 整体概览
以Apache Thrift为例子,框架如下
10.2.2 编解码层
数据格式
-
语言特定格式: 许多编程语言都内建了将内存对象编码为字节序列的支持,例如 java.io.Serializable
-
文本格式: 例如 JSON、XML、CSV 等文本格式,具有人类可读性
-
二进制编码: 具备跨语言和高性能等优点,常见有 Thrift 的 BinaryProtocol,Protobuf,实现可以有多种形式,例如 TLV 编码 和 Varint 编码
选型考察点
- 兼容性:支持自动增加新的字段,而不影响老的服务,这将提高系统的灵活度
- 通用型:支持跨平台、跨语言
- 性能:从空间和时间两个维度来考虑,也就是编码后数据大小和编码耗费时长
10.2.3 协议层
概念
以 Thrift 的 THeader 协议为例
协议解析
10.2.4 网络通信层
Sockets API
网络库
-
提供易用API
- 封装底层 Socket API
- 连接管理和事件分发
-
功能
- 协议支持:tcp、udp和uds等
- 优雅退出、异常处理等
-
性能
- 应用层buffer减少copy
- 高性能定时器、对象池等
- 阻塞 IO 下,耗费一个线程去阻塞在 read(fd) 去等待用足够多的数据可读并返回。
- 非阻塞 IO 下,不停对所有 fds 轮询 read(fd) ,如果读取到 n <= 0 则下一个循环继续轮询。
第一种方式浪费线程(会占用内存和上下文切换开销),第二种方式浪费 CPU 做大量无效工作。而基于 IO 多路复用系统调用实现的 Poll 的意义在于将可读/可写状态通知和实际文件操作分开,并支持多个文件描述符通过一个系统调用监听以提升性能。 网络库的核心功能就是去同时监听大量的文件描述符的状态变化(通过操作系统调用),并对于不同状态变更,高效,安全地进行对应的文件操作。
10.3 RPC 框架核心指标
10.3.1 稳定性
保障策略
- 熔断: 保护调用方,防止被调用的服务出现问题而影响整个链路
- 限流: 保护被调用方,防止大流量把服务压垮
- 超时控制: 避免浪费资源在不可用节点上
从某种程度上讲超时、限流和熔断也是一种服务降级的手段 。
请求成功率
- 负载均衡
- 重试
长尾请求
- BackupRequest
注册中间件
10.3.2 易用性
-
开箱即用
- 合理的默认参数选项、丰富的文档
-
周边工具
- 生成代码工具、脚手架工具
10.3.3 扩展性
- Middleware:middleware 会被构造成一个有序调用链逐个执行,比如服务发现、路由、负载均衡、超时控制等
- Option:作为初始化参数
- 核心层是支持扩展的:编解码、协议、网络传输层
- 代码生成工具也支持插件扩展
10.3.4 观测性
-
三件套
- Log 日志
- Metric 监控
- Tracing 链式跟踪
-
内置观测性服务,用于观察框架内部状态
- 当前环境变量
- 配置参数
- 缓存信息
- 内置 pprof 服务用于排查问题
10.3.5 高性能
场景
- 单机多机
- 单连接多连接
- 单/多client 单/多server
- 不同大小的请求包
- 不同请求类型:例如pingpong、streaming等
目标
- 高吞吐
- 低延迟
手段
- 连接池和多路复用:复用连接,减少频繁建联带来的开销
- 高性能编解码协议:Thrift、Protobuf、Flatbuffer 和 Cap'n Proto 等
- 高性能网络库:Netpoll 和 Netty 等
10.4 字节内部 Kitex 实践分享
10.4.1 整体架构
- 框架文档 Kitex
10.4.2 自研网络库背景
背景
- 原生库无法感知连接状态
- 原生库存在 goroutine 暴涨的风险
自研网络库 Netpoll
- 解决无法感知连接状态问题
- 解决 goroutine 暴涨的风险
- 提升性能
10.4.3 扩展性
支持多协议,也支持灵活的自定义协议扩展
10.4.4 性能优化
参考 字节跳动 Go RPC 框架 KiteX 性能优化实践
网络库优化
- 调度优化
- LinkBuffer 减少内存拷贝,从而减少 GC
- Pool 引入内存池和对象池,减少GC开销
编解码优化
- Codegen: 预计算提前分配内存,inline,SIMD等
- JIT: 无生产代码,将编译过程移到了程序的加载(或首次解析)阶段,可以一次性编译生成对应的 codec 并高效执行
合并部署
微服务过微,引入的额外的传输和序列化开销越来越大
将强依赖的服务统计部署(将亲和性强的服务实例尽可能调度到同一个物理机,远程RPC调用优化为本地IPC调用),有效减少资源消耗