RPC原理与实现|青训营笔记

108 阅读5分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第16天

1.基本概念

1.1本地函数调用

image.png

  1. 将a和b的值压栈
  2. 通过函数指针找到cal函数,进入函数取出栈中的值4和5,将其赋予x和y
  3. 计算x * y,并将结果存在z
  4. 将z的值压栈,然后从cal返回
  5. 从栈中取z返回值,并赋值给result

1.2远程函数调用(RPC-Remote Procedure Calls)

在网上商城购买商品支付金额,将会调用支付服务

RPC需要解决的问题

  1. 函数映射()
  2. 数据转换成字节流
  3. 网络传输

1.3RPC概念模型

1984年Nelson发表了论文《ImplementingRemote Procedure Calls》,其中提出了RPC的过程由5个模型组成: User、User-Stub、RPC-Runtime、Server-Stub、Server

1.4一次RPC的完整过程

  • IDL(Interface description language)文件:IDL通过一种中立的方式来描述接口,使得在不同平台上运行的对象和用不同语言编写的程序可以相互通信
  • 生成代码:通过编译器工具把 IDL 文件转换成语言对应的静态库
  • 编解码:从内存中表示到字节序列的转换称为编码,反之为解码,也常叫做序列化和反序列化
  • 通信协议:规范了数据在网络中的传输内容和格式。除必须的请求/响应数据外,通常还会包含额外的元数据
  • 网络传输:通常基于成熟的网络库走 TCP/UDP 传输

1.5RPC的优点

  1. 单一职责,有利于分工协作和运维开发
  2. 可扩展性强,资源使用率更优
  3. 故障隔离,服务的整体可靠性更高

1.5RPC带来的问题

  1. 服务宕机,对方应该如何处理?
  2. 在调用过程中发生网络异常,如何保证消息的可达性?
  3. 请求量突增导致服务无法及时处理,有哪些应对措施?

2.分层设计

2.1编解码层

2.1.1数据格式

语言特定的格式

许多编程语言都内建了将内存对象编码为字节序列的支持,例如Java有java.io.Serializable

文本格式

JSON、XML、CSV等文本格式,具有人类可读性

二进制编码

具备跨语言和高性能等优点,常见有Thrift的BinaryProtocol,Protobuf等

2.1.2选型

  • 兼容性,支持自动增加新的字段,而不影响老的服务,这将提高系统的灵活度
  • 通用性,支持跨平台、跨语言
  • 性能,从空间和时间两个维度来考虑,也就是编码后数据大小和编码耗费时长

2.2协议层

2.2.1概念

  • 特殊结束符,一个特殊字符作为每个协议单元结束的标示
  • 变长协议,以定长加不定长的部分组成,其中定长的部分需要描述不定长的内容长度

2.3网络通信层

用一个封装好的网络库作为网络通信层,网络库指标如下

提供易用API

  • 封装底层 Socket API
  • 连接管理和事件分发

功能

  • 协议支持:tcp、udp和uds等
  • 优雅退出、异常处理等

性能

  • 应用层buffer减少copy
  • 高性能定时器、对象池等

3.关键指标

3.1稳定性

3.1.1稳定性-保障策略

  • 熔断:保护调用方,防止被调用的服务出现问题而影响到整个链路
  • 限流:保护被调用方,防止大流量把服务压垮
  • 超时控制:避免浪费资源在不可用节点上

3.1.2稳定性-请求成功率

  • 负载均衡
  • 重试

3.1.3稳定性-长尾请求

长尾请求是明显高于平均响应时间的占比较小的请求

3.2易用性

  • 开箱即用,合理的默认参数选项、丰富的文档
  • 周边工具,生成代码工具、脚手架工具

3.3扩展性

  • Middleware
  • Option
  • 编解码层
  • 协议层
  • 网络传输层
  • 代码生成工具插件扩展

3.4观测性

  • Log(日志)、Metric(监控)、Tracing(链路跟踪)
  • 内置观测性服务

3.5高性能

场景

  • 单机多机
  • 单连接多连接
  • 单/多client 单/多server
  • 不同大小的请求包
  • 不同请求类型:例如pingpong、streaming等

目标

  • 高吞吐
  • 低延迟

手段

  • 连接池
  • 多路复用
  • 高性能编解码协议,Thrift、Protobuf、Flatbuffer和Cap'n Proto等
  • 高性能网络库,Netpoll和Netty等

4.企业实战

4.1整体架构-Kitex

  • Kitex Core:核心组件
  • Kitex Byted:与公司内部基础设施集成
  • Kitex Tool:代码生成工具

4.2自研网络库

4.2.1背景

  • 原生库无法感知连接状态,在使用连接池时,池中存在失效连接,影响连接池的复用。
  • 原生库存在goroutine暴涨的风险,一个连接一个goroutine的模式由于连接利用率低下,存在大量goroutine占用调度开销,影响性能。

4.2.2自研网络库-Netpoll

解决无法感知连接状态问题

引入epoll主动监听机制,感知连接状态

解决goroutine暴涨的风险

建立goroutine池,复用goroutine

提升性能

引入Nocopy Buffer,向上层提供NoCopy的调用接口,编解码层面零拷贝

4.2.3扩展性设计

支持多协议,也支持灵活的自定义协议扩展

4.2.4网络库优化

调度优化

  • epoll_wait在调度上的控制
  • gopool重用goroutine降低同时运行协程数

LinkBuffer

  • 读写并行无锁,支持nocopy地流式读写
  • 高效扩缩容
  • Nocopy Buffer池化,减少GC

Pool

  • 引入内存池和对象池,减少GC开销

4.2.5编解码优化

Codegen

  • 预计算并预分配内存,减少内存操作次数,包括内存分配和拷贝
  • Inline减少函数调用次数和避免不必要的反射操作等
  • 自研了Go语言实现的Thrift IDL解析和代码生成器,支持完善的Thrift IDL语法和语义检查,并支持了插件机制-Thriftgo

JIT(Just In Time)

  • 使用JIT编译技术改善用户体验的同时带来更强的编解码性能,减轻用户维护生成代码的负担
  • 基于JIT编译技术的高性能动态Thrift编解码器-Frugal