[ RPC理论 | 青训营笔记]

131 阅读3分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 12 天

RPC基本概念

RPC概念模型

论文《Implementing Remote Procedure Calls》提出RPC过程由5个模型组成:User, User-Stub, RPC-Runtime, Server-Stub, Server。

RPC概念模型

RPC流程

  • IDL (Interface description language)文件:IDL通过一种中立的方式来描述接口,使得在不同平台.上运行 的对象和用不同语言编写的程序可以相互通信
  • 生成代码:通过编译器工具把IDL文件转换成语言对应的静态库
  • 编解码:从内存中表示到字节序列的转换称为编码,反之为解码,也常叫做序列化和反序列化
  • 通信协议:规范了数据在网络中的传输内容和格式。除必须的请求/响应数据外,通常还会包含额外的元数据
  • 网络传输:通常基于成熟的网络库走TCP/UDP传输

RPC好处

  • 单一职责,有利于分工协作和运维开发
  • 可扩展性强,资源使用率更优
  • 故障隔离,服务的整体可靠性更高

RPC痛点

  • 客户端如何应对服务端宕机问题?
  • 调用过程中如何保证消息可达性和网络延时?
  • 如何应对请求量激增导致无法服务的问题?

RPC分层设计

  • 编解码层
  • 协议层
  • 网络通信层

RPC关键指标

稳定性

  • 熔断:一个服务A调用服务B时,服务B的业务逻辑又调用了服务C,而这时服务C响应超时了,由于服务B依赖服务C, C超时直接导致B的业务逻辑一直等待,而这个时候服务A继续频繁地调用服务B,服务B就可能会因为堆积大量的请求而导致服务宕机,由此就导致了服务雪崩的问题
  • 限流:当调用端发送请求过来时,服务端在执行业务逻辑之前先执行检查限流逻辑,如果发现访问量过大并且超出了限流条件,就让服务端直接降级处理或者返回给调用方一个限流异常
  • 超时:当下游的服务因为某种原因响应过慢,下游服务主动停掉一 些不太重要的业务, 释放出服务器资源,避免浪费资源
  • 请求成功率:负载均衡和重试
  • 长尾请求:超过响应耗时阈值之后,发送重试请求,只需收到一次返回结果则结束请求
  • 中间件注册灵活性:采用Option模式

易用性

  • 开箱即用
  • 代码生成工具
  • 脚手架工具

拓展性

  • Middleware
  • Option模式
  • 插件拓展

观测性

  • 日志
  • 链路追踪
  • 内置观测服务

高性能

  • 高延迟
  • 高吞吐

RPC企业实践——Kitex

整体架构

  • Kitex Core:核心组件,定义框架的层次结构
  • Kitex Byted:集成字节公司内部基础设施
  • Kitex Tool:代码生成工具

自研网络库——Netpoll

  • 解决无法感知连接状态问题:引入epoll主动监听机制,感知连接状态
  • 解决goroutine暴涨的风险:建立goroutine池,复用goroutine
  • 提升性能:引入Nocopy Buffer,向上层提供NoCopy的调用接口,编解码层面零拷贝

合并部署

为了防止微服务过微,传输和序列化开销越来越大,将亲和性强的服务实例尽可能调度到同一个物理机,远程RPC调用优化为本地IPC调用

参考资料

RPC 框架分层设计 - 掘金 (juejin.cn)

‍⁣‬⁡⁤⁣‬‍⁣‍⁢⁢⁢‬⁡⁢‬‍‍⁢⁢⁤‌⁣⁤⁤‬⁢⁡‬⁢⁡‬深入浅出 RPC 框架 副本.pptx - 飞书云文档 (feishu.cn)

花了一个星期,我终于把RPC框架整明白了! - 腾讯云开发者社区-腾讯云 (tencent.com)