Spring Cloud 5大组件有哪些?
通常情况下:
Eureka : 注册中心
Ribbon : 负载均衡
Feign : 远程调用
Hystrix : 服务熔断
Zuul/Gateway : 网关
随着SpringCloudAlibba在国内兴起 , 我们项目中使用了一些阿里巴巴的组件
注册中心/配置中心 Nacos
负载均衡 Ribbon
服务调用 Feign
服务保护 sentinel
服务网关 Gateway
微服务技术对比
spring cloud 和 spring cloud alibaba的区别
Spring Cloud和Spring Cloud Alibaba都是用于构建微服务架构的框架,但它们有一些区别和不同的特点:
-
生态系统:
- Spring Cloud是Spring团队开发的项目,构建在Spring框架之上,与Spring Boot完美集成。它是一个开源的微服务框架,提供了一系列的库和工具,用于构建微服务应用,如服务发现、服务治理、负载均衡、断路器等。
- Spring Cloud Alibaba是阿里巴巴公司基于Spring Cloud开发的微服务框架,它在Spring Cloud的基础上增加了一些阿里巴巴生态系统的特性和工具,如Nacos、Sentinel、Dubbo等,用于解决微服务应用中的一些分布式系统问题。
-
注册中心:
- Spring Cloud使用Eureka或Consul等作为服务注册和发现的组件。
- Spring Cloud Alibaba使用Nacos作为默认的注册中心,Nacos是阿里巴巴开发的服务注册中心和配置中心。
-
配置中心:
- Spring Cloud使用Spring Cloud Config或其他外部配置中心(如Git、Vault等)来集中管理和分发配置。
- Spring Cloud Alibaba使用Nacos作为配置中心,可以方便地集成配置管理和服务注册。
-
限流与熔断:
- Spring Cloud使用Hystrix来实现断路器和限流等功能。
- Spring Cloud Alibaba使用Sentinel来实现限流、熔断等功能,Sentinel是阿里巴巴开发的分布式系统的流量控制组件。
-
RPC通信:
- Spring Cloud通常使用HTTP/REST作为微服务之间的通信协议。
- Spring Cloud Alibaba可以集成Dubbo,提供更强大的RPC通信能力。
-
社区和支持:
- Spring Cloud拥有广泛的社区支持,由Spring团队维护,有大量的文档和示例。
- Spring Cloud Alibaba虽然是开源的,但相对较新,社区规模相对较小,但正在不断发展壮大。
根据项目的需求和现有技术栈,可以选择使用Spring Cloud或Spring Cloud Alibaba。在某些情况下,也可以结合使用它们,以充分利用各自的特性和工具来构建微服务应用。
服务注册和发现是什么意思?Spring Cloud 如何实现服务注册发现?
我们当时项目采用的eureka作为注册中心,这个也是spring cloud体系中的一个核心组件
- 服务注册:服务提供者需要把自己的信息注册到eureka,由eureka来保存这些信息,比如服务名称、ip、端口等等
- 服务发现:消费者向eureka拉取服务列表信息,如果服务提供者有集群,则消费者会利用负载 均衡算法,选择一个发起调用
- 服务监控:服务提供者会每隔30秒向eureka发送心跳,报告健康状态,如果eureka服务90秒 没接收到心跳,从eureka中剔除
nacos与eureka的区别?
- Nacos与eureka的共同点(注册中心)
- 都支持服务注册和服务拉取
- 都支持服务提供者心跳方式做健康检测
- Nacos与Eureka的区别(注册中心)
- Nacos支持服务端主动检测提供者状态:临时实例采用心跳模式,非临时实例采用主动检测模式
- 临时实例心跳不正常会被剔除,非临时实例则不会被剔除
- Nacos支持服务列表变更的消息推送模式,服务列表更新更及时
- Nacos集群默认采用AP方式,当集群中存在非临时实例时,采用CP模式;Eureka采用AP方式
- Nacos还支持了配置中心,eureka则只有注册中心,也是选择使用nacos的一个重要原因
项目负载均衡如何实现的 ?
微服务的负载均衡主要使用了一个组件Ribbon,比如,我们在使用feign远程调用的过程中,底层的负载均衡就是使用了ribbon
Ribbon负载均衡策略有哪些 ?
- RoundRobinRule:简单轮询服务列表来选择服务器
- WeightedResponseTimeRule:按照权重来选择服务器,响应时间越长,权重越小
- RandomRule:随机选择一个可用的服务器
- ZoneAvoidanceRule:区域敏感策略,以区域可用的服务器为基础进行服务器的选择。使用Zone对服务器进行分类,这个Zone可以理解为一个机房、一个机架等。而后再对Zone内的多个服务做轮询(默认的负载均衡策略,也就是就近选择,如果没有区域的概念,就是轮询策略)
如果想自定义负载均衡策略如何实现 ?
提供了两种方式:
1,创建类实现IRule接口,可以指定负载均衡策略(全局生效,由spring进行管理,对所有服务的负载均衡都生效)
2,在客户端的配置文件中,可以配置某一个服务调用的负载均衡策略(局部生效,比如只调用user服务则只定义user服务就可以)
什么是服务雪崩,怎么解决这个问题?
服务雪崩:一个服务失败,导致整条链路的服务都失败的情形
解决方案有两种:
- 服务降级:服务自我保护的一种方式,或者保护下游服务的一种方式,用于确保服务不会受请求突增影响变得不可用,确保服务不会崩溃,一般在实际开发中与feign接口整合,编写降级逻辑
- 服务熔断:默认关闭,需要手动打开,如果检测到 10 秒内请求的失败率超过 50%,就触发熔断机制。之后每隔 5 秒重新尝试请求微服务,如果微服务不能响应,继续走熔断机制。如果微服务可达,则关闭熔断机制,恢复正常请求
你们的微服务是怎么监控的?
为什么需要监控?
- 问题定位
- 性能分析
- 服务关系
- 服务告警
Springboot-admin
prometheus+Grafana
zipkin 链路追踪工具,有代码耦合
skywalking 链路追踪工具
我们项目中采用的skywalking进行监控的
1,skywalking主要可以监控接口、服务、物理实例的一些状态。特别是在压测的时候可以看到众多服务中哪些服务和接口比较慢,我们可以针对性的分析和优化。
2,我们还在skywalking设置了告警规则,特别是在项目上线以后,如果报错,我们分别设置了可以给相关负责人发短信和发邮件,第一时间知道项目的bug情况,第一时间修复
你们项目中有没有做过限流 ? 怎么做的 ?
-
先来介绍业务,什么情况下去做限流,需要说明QPS具体多少
我们当时有一个活动,到了假期就会抢购优惠券,QPS最高可以达到2000,平时10-50之间,为了应对突发流量,需要做限流常规限流,为了防止恶意攻击,保护系统正常运行,我们当时系统能够承受最大的QPS是多少(压测结果)
-
nginx限流
控制速率(突发流量),使用的漏桶算法来实现过滤,让请求以固定的速率处理请求,可以应对突发流量
控制并发数,限制单个ip的链接数和并发链接的总数 -
网关限流
在spring cloud gateway中支持局部过滤器RequestRateLimiter来做限流,使用的是令牌桶算法 可以根据ip或路径进行限流,可以设置每秒填充平均速率,和令牌桶总容量
解释一下CAP和BASE
- CAP 定理(一致性、可用性、分区容错性)
- 分布式系统节点通过网络连接,一定会出现分区问题(P)
- 当分区出现时,系统的一致性(C)和可用性(A)就无法同时满足
- BASE理论
- 基本可用
- 软状态
- 最终一致
- 解决分布式事务的思想和模型:
- 最终一致思想:各分支事务分别执行并提交,如果有不一致的情况,再想办法恢复数据(AP)
- 强一致思想:各分支事务执行完业务不要提交,等待彼此结果。而后统一提交或回滚,在等待的过程中,系统就处于软可用状态,这时优先保证了cp,达到了数据的强一致性。(CP)
zookeeper 和 eruka 比较
zookeeper是保证cp,不保证a
eruka是保证ap,不保证c
c和a的选择,没有标准的规定,取决于自己的业务
Eureka可以很好的应对因网络故障导致部分节点失去联系的情况,而不会像zookeeper那样使整个注册服务瘫痪。
Eureka作为单纯的服务注册中心来说要比zookeeper更加“专业”,因为注册服务更重要的是可用性,我们可以接受短期内达不到一致性的状况。
你们采用哪种分布式事务解决方案?
分布式服务的接口幂等性如何设计?
- 幂等: 多次调用方法或者接口不会改变业务状态,可以保证重复调用的结果和单次调用的结果一致
- 如果是新增数据,可以使用数据库的唯一索引
- 如果是新增或修改数据,没有唯一索引,则:
- 分布式锁,性能较低,需要注意快速失败和控制锁的粒度
- 使用token+redis来实现,性能较好
- 第一次请求,生成一个唯一token存入redis,返回给前端
- 第二次请求,业务处理,携带之前的token,到redis进行验证,如果存在,可以执行业务,删除token;如果不存在,则直接返回,不处理业务
你们项目中使用了什么分布式任务调度
xxl-job解决的问题
- 解决集群任务的重复执行问题
- cron表达式定义灵活
- 定时任务失败了,重试和统计
- 任务量大,分片执行
xxl-job路由策略有哪些?
xxl-job任务执行失败怎么解决?
- 路由策略选择故障转移,使用健康的实例来执行任务
- 设置重试次数
- 查看日志+邮件告警来通知相关负责人解决
如果有大数据量的任务同时都需要执行,怎么解决?
- 让多个实例一块去执行(部署集群),路由策略分片广播
- 在任务执行的代码中可以获取分片总数和当前分片,按照取模的方式分摊到各个实例执行