了解RPC框架(Dubbo)
主要是基础知识整理。
一、基础知识
1 为什么要用 Dubbo?
随着服务化的进一步发展,服务越来越多,服务之间的调用和依赖关系也越来越复杂,诞生了面向服务的架构体系(SOA),也因此衍生出了一系列相应的技术。
如对服务提供、服务调用、连接处理、通信协议、序列化方式、服务发现、服务路由、日志输出等行为进行封装的服务框架。就这样,分布式系统的服务治理框架 Dubbo 就出现了。
2 Dubbo 是什么?
Dubbo 是一款高性能、轻量级的开源 RPC 框架,提供服务自动注册、自动发现等高效服务治理方案, 可以和 Spring 框架无缝集成。
3 Dubbo 的使用场景有哪些?
- 透明化的远程方法调用:就像调用本地方法一样调用远程方法,只需简单配置,没有任何API侵入。
- 服务自动注册与发现:不再需要写死服务提供方地址,注册中心基于接口名查询服务提供者的IP地址,并且能够平滑添加或删除服务提供者。
4 Dubbo 核心功能有哪些?
-
Remoting:网络通信框架,提供对多种NIO框架抽象封装,包括“同步转异步”和“请求-响应”模式的信息交换方式。
-
Cluster:服务框架,提供基于接口方法的透明远程过程调用,包括多协议支持,以及软负载均衡,失败容错,地址路由,动态配置等集群支持。
-
Registry:服务注册,基于注册中心目录服务,使服务消费方能动态的查找服务提供方,使地址透明,使服务提供方可以平滑增加或减少机器。
5 Dubbo 核心组件有哪些?
Provider:暴露服务的服务提供方Consumer:调用远程服务消费方Registry:服务注册与发现注册中心Monitor:监控中心和访问调用统计Container:服务运行容器
6 Dubbo 服务器注册与发现的流程?
- 服务容器
Container负责启动,加载,运行服务提供者。 - 服务提供者
Provider在启动时,向注册中心注册自己提供的服务。 - 服务消费者
Consumer在启动时,向注册中心订阅自己所需的服务。 - 注册中心
Registry返回服务提供者地址列表给消费者,如果有变更,注册中心将基于长连接推送变更数据给消费者。 - 服务消费者 Consumer,从服务提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,如果调用失败,再选另一台调用。
- 服务消费者 Consumer 和提供者 Provider ,在内存中累计调用次数和调用时间,定时每分钟发送一次统计数据到监控中心
Monitor。
二、架构设计
三、分布式框架
Dubbo 和 Spring Cloud 有什么关系?
Dubbo 是 SOA 时代的产物,它的关注点主要在于服务的调用,流量分发、流量监控和熔断。
而 Spring Cloud 诞生于微服务架构时代,考虑的是微服务治理的方方面面。
Dubbo 定位服务治理、Spring Cloud 是打造一个生态。
Dubbo 和 Spring Cloud 有什么哪些区别?
-
Dubbo底层是使用Netty这样的NIO框架,是基于TCP协议传输的,配合以 Hession 序列化完成 RPC 通信。 -
Spring Cloud是基于Http协议Rest接口调用远程过程的通信,相对来说 Http 请求会有更大的报文,占的带宽也会更多。但是 REST 相比 RPC 更为灵活。- 服务提供方和调用方的依赖只依靠一纸契约,不存在代码级别的强依赖,这在强调快速演化的微服务环境下,显得更为合适,至于注重通信速度还是方便灵活性,具体情况具体考虑。
四、注册中心
Dubbo 的注册中心集群挂掉,发布者和订阅者之间还能通信么?
可以通讯。
启动 Dubbo 时,消费者会从 Zookeeper 拉取注册的生产者的地址接口等数据,缓存在本地。每次调用时,按照本地存储的地址进行调用。
五、集群
Dubbo集群提供了哪些 负载均衡策略?
RandomLoadBalance: 随机选取提供者策略,有利于动态调整提供者权重。截面碰撞率高,调用次数越多,分布越均匀。RoundRobinLoadBalance: 轮循选取提供者策略,平均分布,但是存在请求累积的问题。LeastActiveLoadBalance: 最少活跃调用策略,解决慢提供者接收更少的请求。ConstantHashLoadBalance: 一致性 Hash 策略,使相同参数请求总是发到同一提供者,一台机器宕机,可以基于虚拟节点,分摊至其他提供者,避免引起提供者的剧烈变动。
默认为 Random 随机调用。
六、配置
七、通信协议
八、RPC
为什么要有RPC
但是如果是一个大型的网站,内部子系统较多、接口非常多的情况下,RPC框架的好处就显示出来了。
- 首先就是长链接,不必每次通信都要像http一样去3次握手什么的,减少了网络开销。
- RPC框架一般都有注册中心,有丰富的监控管理;发布、下线接口、动态扩展等,对调用方来说是无感知、统一化的操作。
- 安全性。
RPC和SOA、SOAP、REST的区别
-
REST:
HTTP协议的一种直接应用,默认基于JSON作为传输格式 -
SOA:面向服务架构
RPC使用了哪些关键技术?
-
动态代理
- 可以使用
JDK提供的原生的动态代理机制 - 也可以使用开源的:
CGLib代理
- 可以使用
-
序列化和反序列化
FastJson
-
NIO
- 出于并发性能的考虑,传统的阻塞式 IO 显然不太合适。
- 因此我们需要异步的 IO ,即 NIO。
-
服务注册中心
- 可选:Redis、Zookeeper、Consul 、Etcd。
- 一般使用ZooKeeper提供服务注册与发现功能,解决单点故障以及分布式部署的问题(注册中心)。
RPC的实现原理架构图
两台服务器A,B,一个应用部署在A服务器上,想要调用B服务器上应用提供的函数/方法,由于不在一个内存空间,不能直接调用,需要通过网络来表达调用的语义和传达调用的数据。
比如说,A服务器想调用B服务器上的一个方法:
(1)建立通信
主要是通过在客户端和服务器之间建立TCP连接,远程过程调用的所有交换的数据都在这个连接里传输。
连接可以是按需连接,调用结束后就断掉,也可以是长连接,多个远程过程调用共享同一个连接。
(2)服务寻址
-
A服务器上的应用怎么告诉底层的RPC框架,如何连接到B服务器
- 主机名或IP地址、以及特定的端口、指定调用的方法或者函数的名称、以及入参出参等信息,基于B机器的以上信息才能完成服务的一个调用。
-
可靠的寻址方式(主要是提供服务的发现)是RPC的实现基石
- 可以采用
Redis或者Zookeeper来注册服务
- 可以采用
(3)网络传输
-
序列化:由于网络协议是基于二进制的,传输的数据需要先进行序列化(Serialize)才能在网络中进行传输。
-
反序列化:将二进制信息恢复为内存中的表达方式
(4)服务调用
- B机器进行本地调用(通过代理Proxy和反射调用)之后得到了返回值
九、其它
Dubbo 支持哪些序列化方式?
默认使用 Hessian 序列化,还有 Duddo、FastJson、Java 自带序列化。