分布式定时任务 | 青训营笔记

61 阅读2分钟

这是我参与「第五届青训营 」笔记创作活动的第十四天

分布式定时任务

发展历程

  • Windows批处理
  • Windows任务计划程序
  • Linux命令-Cronjob
  • 单机定时任务
  • 任务调度-Quartz
  • 分布式定时任务
    • 平台化管理
    • 分布式部署
    • 支持海量数据

特点

  • 自动化: 全自动完成定时任务的调度和执行
  • 平台化: 基于平台化的思维管控一系列的分布式定时任务
  • 分布式: 在分布式系统环境下运行任务调度,突破单机定时任务的性能瓶颈
  • 伸缩性: 采用集群方式部署,可以随时按需扩缩容
  • 高可用: 单点故障不影响最终任务结果,可以做到故障转移

执行方式

  • 单机任务: 随机触发一台机器执行任务,适用于计算量小、并发度低的任务
  • 广播任务: 广播到所有机器上执行同一个任务,比如所有机器一起清理日志
  • Map任务: 一个任务可以分出多个子任务,每个子任务负责一部分的计算。适用于计算量 大,单机无法满足要求的任务
  • MapReduce任务: 在Map任务的基础上,还可以对所有子任务的结果做汇总计算,适用于计算量大,并且需要对子任务结果做汇总的任务

实现原理

整体架构

核心架构

  • 触发器:解析任务、生成触发事件
  • 调度器:分配任务、管理任务生命周期
  • 执行器:获取执行任务单元、执行任务逻辑
  • 控制台:提供任务管理和干预功能

功能架构

image.png

控制台

任务元数据

  • 基础信息
  • 调度时机
  • 执行行为
  • 执行方式

任务实例

  • job_id
  • 触发时间
  • 状态和结果
  • 过程信息

触发器

设计约束

  • 需支持大量任务
  • 需支持秒级的调度
  • 周期任务需要多次执行
  • 需保证秒级扫描的高性能,并避免资源浪费

高可用

  • 数据库行锁
  • 分布式锁 性能较高

调度器

资源来源

  • 业务系统提供机器资源
  • 定时任务平台提供机器资源

执行器

先进行机器注册 实现执行器弹性扩缩容

总结

image.png

课程总结

image.png