这是我参与「第三届青训营 -后端场」笔记创作活动的第3篇笔记
分布式定时任务
什么是分布式定时任务
-
自动化+定时执行+海量数据+高效稳定 = 分布式定时任务。
-
定时任务是指系统为了自动完成特定任务,实时、延时、周期性完成任务调度的过程。
-
分布式定时任务是把分散的、可靠性差的定时任务纳入统一的平台,并实现集群管理调度和分布式部署的一种定时任务的管理方式。
分布式定时任务的特点
- 自动化:全自动完成定时任务的调度和执行
- 平台化:基于平台化的思维管控一系列的分布式定时任务
- 分布式:在分布式系统环境下运行任务调度,突破单机定时任务的性能瓶颈
- 伸缩性:采用集群方式部署、可以随时按需扩缩容
- 高可用:单点故障不影响最终任务结果、可以做到故障转移
分布式定时任务-执行方式
- 单机任务
- 广播任务
- Map任务
- MapReduce任务
业内定时任务框架
- Xxl-job
- SchedulerX
- TCT
- Elastic-job
- Saturn
核心架构——解决触发、调度、执行三个关键问题
Admin 控制台:提供任务管理和干预的功能
- 任务元数据:用户对任务属性定义,包括任务类型调度时机,执行行为等。
- 任务实例:一个确定的job的一次运行实例。
Trigger 触发器:解析任务,生成触发事件
-
实现方案
-
定期扫描+延时消息
-
时间轮
环形存储队列,底层用数组实现,数组中的每个元素可以存放一个定时任务列表。
链表、最小堆、时间轮、多级时间轮
-
-
高可用性——分布式锁模式
Scheduler 调度器:分配任务,管理任务生命周期
-
资源调度
-
节点调度
-
随机节点执行
-
广播执行
-
分片执行
-
-
任务分片
-
任务编排
-
故障转移
-
Executor 执行器:获取执行任务单元、执行任务逻辑
- 注册
- 调度
- 回调
- 心跳检测