这是我参与「第五届青训营 」笔记创作活动的第十四天
分布式定时任务
发展历程
- Windows批处理
- Windows任务计划程序
- Linux命令-Cronjob
- 单机定时任务
- 任务调度-Quartz
- 分布式定时任务
- 平台化管理
- 分布式部署
- 支持海量数据
特点
- 自动化: 全自动完成定时任务的调度和执行
- 平台化: 基于平台化的思维管控一系列的分布式定时任务
- 分布式: 在分布式系统环境下运行任务调度,突破单机定时任务的性能瓶颈
- 伸缩性: 采用集群方式部署,可以随时按需扩缩容
- 高可用: 单点故障不影响最终任务结果,可以做到故障转移
执行方式
- 单机任务: 随机触发一台机器执行任务,适用于计算量小、并发度低的任务
- 广播任务: 广播到所有机器上执行同一个任务,比如所有机器一起清理日志
- Map任务: 一个任务可以分出多个子任务,每个子任务负责一部分的计算。适用于计算量 大,单机无法满足要求的任务
- MapReduce任务: 在Map任务的基础上,还可以对所有子任务的结果做汇总计算,适用于计算量大,并且需要对子任务结果做汇总的任务
实现原理
整体架构
核心架构
- 触发器:解析任务、生成触发事件
- 调度器:分配任务、管理任务生命周期
- 执行器:获取执行任务单元、执行任务逻辑
- 控制台:提供任务管理和干预功能
功能架构
控制台
任务元数据
- 基础信息
- 调度时机
- 执行行为
- 执行方式
任务实例
- job_id
- 触发时间
- 状态和结果
- 过程信息
触发器
设计约束
- 需支持大量任务
- 需支持秒级的调度
- 周期任务需要多次执行
- 需保证秒级扫描的高性能,并避免资源浪费
高可用
- 数据库行锁
- 分布式锁 性能较高
调度器
资源来源
- 业务系统提供机器资源
- 定时任务平台提供机器资源
执行器
先进行机器注册 实现执行器弹性扩缩容