什么是分布式调度
什么是分布式任务调度?有两层含义:
- 运⾏在分布式集群环境下的调度任务(同⼀个定时任务程序部署多份,只应该有⼀个定时任务在执⾏)
- 分布式调度—>定时任务的分布式—>定时任务的拆分(即为把⼀个⼤的作业任务拆分为多个⼩的作业任务,同时执⾏)
Elastic-Job介绍
Elastic-Job
是当当⽹开源的⼀个分布式调度解决⽅案,基于Quartz
⼆次开发的,由两个相互独⽴的⼦项⽬Elastic-Job-Lite
和Elastic-Job-Cloud
组成。这里主要说明的是Elastic-Job-Lite
,它定位为轻量级⽆中⼼化解决⽅案,使⽤Jar
包的形式提供分布式任务的协调服务。
主要功能:
- 分布式调度协调:在分布式环境中,任务能够按指定的调度策略执⾏,并且能够避免同⼀任务多实例重复执⾏
- 丰富的调度策略 基于成熟的定时任务作业框架
Quartz cron
表达式执⾏定时任务 - 弹性扩容缩容 当集群中增加某⼀个实例,它应当也能够被选举并执⾏任务;当集群减少⼀个实例时,它所执⾏的任务能被转移到别的实例来执⾏。
- 失效转移 某实例在任务执⾏失败后,会被转移到其他实例执⾏
- 错过执⾏作业重触发:若因某种原因导致作业错过执⾏,⾃动记录错过执⾏的作业,并在上次作业完成后⾃动触发。
- ⽀持并⾏调度:⽀持任务分⽚,任务分⽚是指将⼀个任务分为多个⼩任务项在多个实例同时执⾏
- 作业分⽚⼀致性:当任务被分⽚后,保证同⼀分⽚在分布式环境中仅⼀个执⾏实例。
Elastic-Job-Lite轻量级去中⼼化的特点
轻量级:
- 全是
jar
引用,必要依赖只有zookeeper
- 不需要独立部署
去中心化:
- 执行节点对等:程序和
jar
一样,唯一不一样的可能是分片 - 定时调度自触发:没有中心调度节点分配
- 服务自发现
- 主节点非固定
Elastic-Job-Lite应⽤
jar包(API) + 安装zk软件
Elastic-Job
依赖于Zookeeper
进⾏分布式协调,所以需要安装Zookeeper
软件(3.4.6版本以上),此处需要明⽩Zookeeper
的本质功能:存储+通知。
任务分片
⼀个⼤的⾮常耗时的作业Job
,⽐如:⼀次要处理⼀亿的数据,那这⼀亿的数据存储在数据库中,如果⽤⼀个作业节点处理⼀亿数据要很久,在互联⽹领域是不太能接受的,互联⽹领域更希望机器的增加去横向扩展处理能⼒。所以,ElasticJob
可以把作业分为多个的task
(每⼀个task
就是⼀个任务分⽚),每⼀个task
交给具体的⼀个机器实例去处理(⼀个机器实例是可以处理多个task
的),但是具体每个task
执⾏什么逻辑由我们⾃⼰来指定。
Strategy策略定义这些分⽚项怎么去分配到各个机器上去,默认是平均去分,可以定制,⽐如某⼀个机器负载⽐较⾼或者预配置⽐较⾼,那么就可以写策略。分⽚和作业本身是通过⼀个注册中⼼协调的,因为在分布式环境下,状态数据肯定集中到⼀点,才可以在分布式中沟通。
代码片段:
弹性扩容
新增加⼀个运⾏实例app3
,它会⾃动注册到注册中⼼,注册中⼼发现新的服务上线,注册中⼼会通知ElasticJob
进⾏重新分⽚,那么总的分⽚项有多少,那么就可以搞多少个实例机器,⽐如完全可以分1000
⽚。
1.分⽚项也是⼀个JOB配置,修改配置,重新分⽚,在下⼀次定时运⾏之前会重新调⽤分⽚算法,那么这个分⽚算法的结果就是:哪台机器运⾏哪⼀个⼀⽚,这个结果存储到zk中的,主节点会把分⽚给分好放到注册中⼼去,然后执⾏节点从注册中⼼获取信息(执⾏节点在定时任务开启的时候获取相应的分⽚)。
2.如果所有的节点挂掉值剩下⼀个节点,所有分⽚都会指向剩下的⼀个节点,这也是ElasticJob的⾼可⽤。
说明
文章内容输出来源:拉勾教育Java高薪训练营课程归纳总结