深入浅出RPC框架 | 青训营

64 阅读6分钟

青训营笔记打卡第六篇 : 深入浅出RPC

基础概念

本地函数调用

代码 :

func main( ){
 var a = 2
 var b = 3
 result := calculate(a, b)
 fmt.Println(result)
 return
}
func calculate(x, y int) {
 z := x*y
 return z
}
  1. 将a和b的值压栈
  2. 通过函数指针找到calculate函数,进入函数取出栈中的值2和3,将其赋予x和y
  3. 计算x*y,并将结果存在z
  4. 将Z的值压栈,然后从calculate返回
  5. 从栈中取出z返回值,并赋值给result

以上步骤只是为了说明原理。事实上编译器经常会做优化,对于参数和返回值少的情况会直接将其存放在寄存器,而不需要压栈弹栈的过程,甚至都不需要调用call,而直接做inline操作。

远程函数调用

RPC需要解决的问题

  1. 函数映射
  2. 数据转换成字节流
  3. 网络传输

我们怎么告诉支付服务我们要调用付款这个函数,而不是退款或者充值呢?

  • 在本地调用中,函数体是直接通过函数指针来指定的,我们调用哪个方法,编译器就自动帮我们调用它相应的函数指针。
  • 但是在远程调用中,函数指针是不行的,因为两个进程的地址空间是完全不一样的。所以函数都有自己的一个ID,在做 RPC的时候要附上这个 ID,还得有个 ID 和函数的对照关系表,通过 ID找到对应的函数并执行。

客户端怎么把参数值传给远程的函数呢?

  • 在本地调用中,我们只需要把参数压到栈里,然后让函数自己去栈里读就行。
  • 但是在远程过程调用时,客户端跟服务端是不同的进程,不能通过内存来传递参数。这时候就需要客户端把参数先转成一个字节流,传给服务端后,再把字节流转成自己能读取的格式。

远程调用往往用在网络上,如何保证在网络上高效稳定地传输数据?

RPC概念模型

image-20230811005511878.png

一次RPC的完整过程

image-20230811005804777.png

  • IDL (Interface description language)文件 IDL通过一种中立的方式来描述接口,使得在不同平台上运行的对象和用不同语言编写的程序可以相互通信
  • 生成代码 通过编译器具把IDL文件转换成语言对应的静态库
  • 编解码 从内存中表示到字节序列的转换称为编码,反之为解码,也常叫做序列化和反序列化
  • 通信协议 规范了数据在网络中的传输内容和格式。除必须的请求/响应数据外,通常还会包含额外的元数据
  • 网络传输 通常基于成熟的网络库走TCP/UDP传输

相比本地函数调用,远程调用的话我们不知道对方有哪些方法,以及参数长什么样,所以需要有一种方式来描述或者说声明我有哪些方法,方法的参数都是什么样子的,这样的话大家就能按照这个来调用,这个描述文件就是 IDL 文件

服务双方是通过约定的规范进行远程调用,双方都依赖同一份IDL文件,需要通过工具来生成对应的生成文件,具体调用的时候用户代码需要依赖生成代码,所以可以把用户代码和生成代码看做一个整体。

编码只是解决了跨语言的数据交换格式,但是如何通讯呢?需要制定通讯协议,以及数据如何传输?我的网络模型如何呢?那就是这里的 transfer 要做的事情。

RPC的好处

  1. 单一指针,有利于分工协作和运维开发
  2. 可扩展性强,资源利用率更优
  3. 故障隔离,服务整体的可靠性更高

image-20230811234840203.png

RPC带来的问题

  1. 服务宕机,对方应该如何处理
  2. 在调用过程中发生网络异常,如何保证消息的可达性
  3. 请求量突增导致服务无法及时处理,有哪些应对措施?

分层设计

RPC框架采用分层设计,包括了以下三层 :

  • 编解码层
  • 协议层
  • 网络通信层

以Apache Thrift为例

image-20230815202313237.png

编解码层 - 生成代码

Client和Server依赖同一份IDL文件,然后根据不同的编程语言生成不同的CodeGen

image-20230815202500854.png

编解码层 - 数据格式

  • 语言特定的格式 : 许多编程语言都内建了将内存对象编码为字节序列的支持,例如java有java.io.Serializable
  • 文本格式 : JSON,XML,CSV等文本格式,具有人类可读性
  • 二进制编码 : 具有快语言和高性能等有点,常见的有THrift的BinaryProtocol,Protobuf等

编解码层 - 二进制编码

TLV编码

  • Tag : 标签,可以理解为类型
  • Length : 长度
  • Value : 值,Value也是一个TLV结构

编解码层 - 选型

  • 兼容性

    支持自动增加新的字段,而不影响老的服务,这将提高系统的灵活度

  • 通用性 :

    支持跨平台,语言

  • 性能 :

    从空间和时间两个维度来考虑,也就是编码后数据大小和编码耗费时长

协议层

  • 特殊结束符

    一个特殊字符作为每个协议单元结束的标识

image-20230815204114972.png

  • 变长协议

    以定长加不定长的部分组成,其中定长的部分需要描述不定长的内容长度

image-20230815204222095.png

协议层 - 协议构造

image-20230815204315324.png

关键指标

稳定性

保障策略 :

  • 熔断 : 保护调用方,防止被调用的服务出现问题而影响到整个链路
  • 限流 : 保护被调用方,防止大流量把服务压垮
  • 超时限制 : 避免浪费资源在不可用的结点上

image-20230815204740502.png

请求成功率 :

  • 负载均衡
  • 重试 : 重试可以增加请求的成功率

长尾请求

Backup Request

长尾请求 : 明显高于平均响应时间,占比比较少的请求

image-20230815212144687.png

提高长尾请求的成功率 : Backup Request

左图 : 常规方式,右图 : Backup Request

注册中间件

image-20230815212359784.png

易用性

  • 开箱即用

    合理的默认参数选项,丰富的文档

  • 周边工具

    生成代码工具,脚手架工具

image-20230815212541455.png

扩展性

  • Middleware
  • Option
  • 编解码层
  • 协议层
  • 网络传输层
  • 代码生成工具插件扩展

观测性

  • Log , Metric, Tracing
  • 内置观测行服务

高性能

场景 :

  • 单机多机
  • 单连接多连接
  • 单/多client 单/多server
  • 不同大小的请求包
  • 不同请求类型 : 例如 pingpong,streaming等

目标

  • 高吞吐
  • 高延迟

手段

  • 连接池
  • 多路复用
  • 高性能编解码协议
  • 高性能网络库

总结 :

image-20230815214106888.png