分布式定时任务|青训营笔记

50 阅读2分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 11 天

什么是分布式定时任务?

  • 定时任务是指系统为了自动完成特定任务,实时、延时、周期性完成任务调度的过程。
  • 分布式定时任务是把分散的、可靠性差的定时任务纳入统一的平台,并实现集群管理调度和分布式部署的一种定时任务的管理方式。

实现原理

1. 核心架构

分布式定时任务核心要解决触发、调度、执行三个关键问题

  • 触发器:Trigger,解析任务,生成触发事件
  • 调度器:Scheduler,分配任务,管理任务生命周期
  • 执行器:Executor,获取执行任务单元,执行任务逻辑
  • 控制台:Admin,提供任务管理和干预的功能

image.png

数据流

image.png

功能架构

image.png

2. 控制台

  • 任务:Job,任务元数据
  • 任务实例:JobInstance,周期任务会生成多个任务实例
  • 任务结果:JobResult,任务实例运行的结果
  • 任务历史:JobHistory,用户可以修改任务信息,任务实例对应的任务元数据可以不同,因而使用任务历史存储

image.png

3. 触发器

方案一:腾讯字节方案

image.png

方案二:Quartz方案——时间轮

image.png

4. 调度器

节点选择

image.png

任务分片

image.png

执行器Executor

image.png

业务

  • 业务应用

    • 所有需要定时、延时、周期性执行任务的业务场景,都可以考虑使用分布式定时任务
    • 知识面扩充
  • 分布式定时任务

    • 单机定时任务
    • 延时消息
    • 离线计算引擎Hive
    • 实时计算引擎Flink

总结与感受

之前也接触过定时任务,看过一些定时任务框架的开源代码,但是没有具体了解其中的原理,今天受益良多。

参考链接

  1. bytedance.feishu.cn/file/boxcn5…
  2. juejin.cn/post/719632…