分布式RPC框架dubbo

201 阅读7分钟

了解RPC框架(Dubbo)

主要是基础知识整理。

一、基础知识

1 为什么要用 Dubbo?

随着服务化的进一步发展,服务越来越多,服务之间的调用和依赖关系也越来越复杂,诞生了面向服务的架构体系(SOA),也因此衍生出了一系列相应的技术。

如对服务提供、服务调用、连接处理、通信协议、序列化方式、服务发现、服务路由、日志输出等行为进行封装的服务框架。就这样,分布式系统的服务治理框架 Dubbo 就出现了。

2 Dubbo 是什么?

Dubbo 是一款高性能、轻量级的开源 RPC 框架,提供服务自动注册、自动发现等高效服务治理方案, 可以和 Spring 框架无缝集成。

3 Dubbo 的使用场景有哪些?

  • 透明化的远程方法调用:就像调用本地方法一样调用远程方法,只需简单配置,没有任何API侵入。
  • 服务自动注册与发现不再需要写死服务提供方地址,注册中心基于接口名查询服务提供者的IP地址,并且能够平滑添加或删除服务提供者。

4 Dubbo 核心功能有哪些?

  • Remoting:网络通信框架,提供对多种NIO框架抽象封装,包括“同步转异步”和“请求-响应”模式的信息交换方式。

  • Cluster:服务框架,提供基于接口方法的透明远程过程调用,包括多协议支持,以及软负载均衡,失败容错,地址路由,动态配置等集群支持。

  • Registry:服务注册,基于注册中心目录服务,使服务消费方能动态的查找服务提供方,使地址透明,使服务提供方可以平滑增加或减少机器。

5 Dubbo 核心组件有哪些?

image.png

  • Provider:暴露服务的服务提供方
  • Consumer:调用远程服务消费方
  • Registry:服务注册与发现注册中心
  • Monitor:监控中心和访问调用统计
  • Container:服务运行容器

6 Dubbo 服务器注册与发现的流程?

  • 服务容器 Container 负责启动,加载,运行服务提供者。
  • 服务提供者 Provider 在启动时,向注册中心注册自己提供的服务。
  • 服务消费者 Consumer 在启动时,向注册中心订阅自己所需的服务。
  • 注册中心 Registry 返回服务提供者地址列表给消费者,如果有变更,注册中心将基于长连接推送变更数据给消费者。
  • 服务消费者 Consumer从服务提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,如果调用失败,再选另一台调用。
  • 服务消费者 Consumer 和提供者 Provider ,在内存中累计调用次数和调用时间,定时每分钟发送一次统计数据到监控中心 Monitor

二、架构设计

三、分布式框架

Dubbo 和 Spring Cloud 有什么关系?

DubboSOA 时代的产物,它的关注点主要在于服务的调用,流量分发、流量监控和熔断。

Spring Cloud 诞生于微服务架构时代,考虑的是微服务治理的方方面面。

Dubbo 定位服务治理、Spring Cloud 是打造一个生态。

Dubbo 和 Spring Cloud 有什么哪些区别?

  • Dubbo 底层是使用 Netty 这样的 NIO 框架,是基于 TCP 协议传输的,配合以 Hession 序列化完成 RPC 通信。

  • Spring Cloud 是基于 Http 协议 Rest 接口调用远程过程的通信,相对来说 Http 请求会有更大的报文,占的带宽也会更多。但是 REST 相比 RPC 更为灵活。

    • 服务提供方和调用方的依赖只依靠一纸契约,不存在代码级别的强依赖,这在强调快速演化的微服务环境下,显得更为合适,至于注重通信速度还是方便灵活性,具体情况具体考虑。

四、注册中心

Dubbo 的注册中心集群挂掉,发布者和订阅者之间还能通信么?

可以通讯。

启动 Dubbo 时,消费者会从 Zookeeper 拉取注册的生产者的地址接口等数据,缓存在本地。每次调用时,按照本地存储的地址进行调用。

五、集群

Dubbo集群提供了哪些 负载均衡策略?

  • Random LoadBalance: 随机选取提供者策略,有利于动态调整提供者权重。截面碰撞率高,调用次数越多,分布越均匀。
  • RoundRobin LoadBalance: 轮循选取提供者策略,平均分布,但是存在请求累积的问题。
  • LeastActive LoadBalance: 最少活跃调用策略,解决慢提供者接收更少的请求。
  • ConstantHash LoadBalance: 一致性 Hash 策略,使相同参数请求总是发到同一提供者,一台机器宕机,可以基于虚拟节点,分摊至其他提供者,避免引起提供者的剧烈变动。

默认为 Random 随机调用。

六、配置

七、通信协议

八、RPC

为什么要有RPC

但是如果是一个大型的网站,内部子系统较多、接口非常多的情况下,RPC框架的好处就显示出来了。

  • 首先就是长链接,不必每次通信都要像http一样去3次握手什么的,减少了网络开销
  • RPC框架一般都有注册中心,有丰富的监控管理;发布、下线接口、动态扩展等,对调用方来说是无感知、统一化的操作
  • 安全性。

RPC和SOA、SOAP、REST的区别

  • RESTHTTP 协议的一种直接应用,默认基于 JSON 作为传输格式

  • SOA:面向服务架构

RPC使用了哪些关键技术?

  • 动态代理

    • 可以使用 JDK 提供的原生的动态代理机制
    • 也可以使用开源的:CGLib 代理
  • 序列化和反序列化

    • FastJson
  • NIO

    • 出于并发性能的考虑,传统的阻塞式 IO 显然不太合适。
    • 因此我们需要异步的 IO ,即 NIO。
  • 服务注册中心

    • 可选:Redis、Zookeeper、Consul 、Etcd。
    • 一般使用ZooKeeper提供服务注册与发现功能,解决单点故障以及分布式部署的问题(注册中心)。

RPC的实现原理架构图

两台服务器A,B,一个应用部署在A服务器上,想要调用B服务器上应用提供的函数/方法,由于不在一个内存空间,不能直接调用,需要通过网络来表达调用的语义和传达调用的数据。

比如说,A服务器想调用B服务器上的一个方法:

(1)建立通信

主要是通过在客户端和服务器之间建立TCP连接,远程过程调用的所有交换的数据都在这个连接里传输。

连接可以是按需连接,调用结束后就断掉,也可以是长连接,多个远程过程调用共享同一个连接。

(2)服务寻址

  • A服务器上的应用怎么告诉底层的RPC框架,如何连接到B服务器

    • 主机名或IP地址、以及特定的端口、指定调用的方法或者函数的名称、以及入参出参等信息,基于B机器的以上信息才能完成服务的一个调用。
  • 可靠的寻址方式(主要是提供服务的发现)是RPC的实现基石

    • 可以采用 Redis 或者 Zookeeper 来注册服务

(3)网络传输

  • 序列化:由于网络协议是基于二进制的,传输的数据需要先进行序列化(Serialize)才能在网络中进行传输。

  • 反序列化:将二进制信息恢复为内存中的表达方式

(4)服务调用

  • B机器进行本地调用(通过代理Proxy和反射调用)之后得到了返回值

九、其它

Dubbo 支持哪些序列化方式?

默认使用 Hessian 序列化,还有 Duddo、FastJson、Java 自带序列化。

参考&推荐

juejin.cn/post/684490…