深入浅出RPC框架|青训营笔记

100 阅读6分钟

这是我参与「第三届青训营 -后端场」笔记创作活动的的第 7 篇笔记

一、基本概念

远程函数调用(RPC-Remote Procedure Calls)

需要解决的问题:

  1. 函数映射
  2. 数据转换成字节流
  3. 网络传输

RPC概念模型

image.png

一次RPC的完整过程

  1. IDL文件:通过一种中立的方式来描述接口,使得在不同平台上运行的对象和用不同语言编写的程序可以相互通信
  2. 生成代码:通过编译器工具吧IDL文件转换成语言对应的静态库
  3. 编解码:从内存中表示到字节序列的转换称为编码,反之称为解码,也常叫做序列化和反序列化
  4. 通信协议:规范了数据在网络中的传输内容和格式,除必须的请求/响应数据外,通常还会包含额外的元数据
  5. 网络传输:通常基于成熟的网络库走TCP/UDP传输

RPC的好处

  1. 单一职责,有利于分工写作和运维开发,不同的服务可以用不同的语言进行开发
  2. 可扩展性强,资源使用率更优
  3. 故障隔离,服务的整体可靠性更高

RPC带来的问题

  1. 服务宕机,调用方应该如何处理?
  2. 在调用过程中发生网络异常,如何保证消息可达?
  3. 请求量突增导致服务无法及时处理,有哪些应对措施? 这些问题是RPC框架需要解决的

二、分层设计

编解码层

生成代码

image.png

数据格式

  1. 语言特定的格式:许多编程语言内建了将内存对象编码为字节序列的支持,例如Java有Java.io.Serializable
  2. 文本格式:JSON、XML、CSV等文本格式,具有人类可读性
  3. 二进制编码:具备跨语言和高性能等优点,常见的有Thrift的BinaryProtocol,Protobuf等

二进制编码

TLV编码

  • Tag:标签,可以理解为类型
  • Length:长度
  • Value:值,值也可以是一个TLV结构

编码选型

  1. 兼容性:支持自动增加新的字段,而不影响老的服务,这将提高系统的灵活度
  2. 通用性:支持跨平台,跨语言
  3. 性能:从空间和时间两个未读来考虑,也就是编码后数据的大小和编码耗费的时长

协议层

概念

  1. 特殊结束符:一个特殊字符作为每个协议单元结束的标识
  2. 变长协议:以定长加不定长部分组成,其中定长的部分需要描述不定长部分的长度

协议构造

  • LENGTH:数据包大小,不包含自身
  • HEADER MAGIC:标识版本信息,协议解析时候快速校验
  • SEQUENCE NUMBER:表示数据包的seqID,可用于多路复用,但链接内递增
  • HEADER SIZE:头部长度,从第14个字节开始计算一致到PAYLOAD前
  • PTOTOCOL ID:编解码方式,有Binary和Compact两种
  • TRANSFORM ID:压缩方式,入zlib和snappy
  • INFO ID:传第一些定制的meta信息
  • PAYLOAD:消息体

协议解析

image.png

网络通信层

Sockets API

image.png

网络库

  1. 提供易用API:封装底层Socket API,连接管理和事件分发
  2. 功能:协议支持tcp、udp和uds等,优雅退出,异常处理等
  3. 性能:应用层buffer减少copy,高性能定时器、对象池等

三、关键指标

稳定性(通过注册中间件解决)

保障策略

  1. 熔断:保护调用方,防止被调用的服务出现问题而影响整个链路
  2. 限流:保护被调用方,防止大流量把服务压垮
  3. 超时控制:避免浪费资源在不可用节点上

请求成功率

  1. 负载均衡
  2. 失败重试

长尾请求

长尾请求是指响应耗时比较长的部分请求,如网络抖动造成
普通重试

image.png
Backup Request

image.png

易用性

  1. 开箱即用:合理的默认参数选项,丰富的文档
  2. 周边工具:生成代码工具,脚手架工具

扩展性

image.png

观测性

  1. Log、Metic、Tracing
  2. 内置观测性服务

高性能

场景

  1. 单机多机
  2. 单连接多链接
  3. 单/多client 单/多server
  4. 不同大小等请求包
  5. 不同请求类型,如pingpoong、streaming等

目标

  1. 高吞吐
  2. 低延迟

优化手段

  1. 连接池
  2. 多路复用
  3. 高性能编解码协议
  4. 高性能网络库

四、企业实践-字节内部rpc框架kitex

整体架构

  1. Kitex Core:核心组件
  2. Kitex Byted:与公司内部基础设施集成
  3. kitex Tool:代码生成工具

image.png

自研网络库

背景

  1. 原生库无法感知连接状态:使用连接池时,池中存在失效连接,影响连接的复用
  2. 原生库粗壮乃goroutine暴涨的风险:一个连接一个goroutine的模式,由于连接利用率低下,存在大量goroutine占用调度开销,影响性能

Netpoll

  1. 解决无法感知连接状态问题:引入epoll主动监听机制,感知连接状态
  2. 解决goroutine保障风险:建立goroutine池,复用goroutine
  3. 提升性能:引入Nocopy Buffer,向上层提供NoCopy的调用接口,编解码层零拷贝

扩展性设计

支持多协议,也支持灵活的自定义协议扩展

image.png

性能优化

网络库优化

  1. 调度优化:epoll_在调度上的控制,gopool重用goroutine降低同时运行协程数
  2. LinkBuffer:读写并行无锁,支持nocopy地流式读写,高效扩缩容,Nocopy Buffer池化,减少GC
  3. Pool:引入内存池和对象池,减少GC开销

编辑码优化

  1. Codegen:预计算并预分配内存,减少内存操作次数,包括内存分配和拷贝,inline减少内存调用次数和不必要的反射操作,自研go实习那的Thrift IDL解析和代码生成器,支持完善的Thrift IDL语法和语义检查,并支持了插件机制
  2. JIT:使用JIT编译技术改善用户体验的同时带来更强的编解码性能,减轻用户维护生成代码的负担。基于JIT编译技术的高性能动态Thrift编解码器-Frugal

合并部署

微服务过微,传输和序列化开销越来越大,将亲和性强的服务实例尽可能调度到一个物理机,远程RPC调用优化为本地IPC调用