分布式定式任务那些事儿 | 青训营笔记

98 阅读4分钟

这是我参与「第三届青训营 -后端场」笔记创作活动的的第2篇笔记

1前言

分布式定时任=自动化+定时执行+海量数据+高效稳定

2发展历程

windows任务计划程序:右键管理

image.png linux命令-cronjob

image.png 单机定时任务-timer、ticker

image.png 单机定时任务-单机定时任务-timer、ticker

image.png 分布式定时任务: 平台化管理 分布式部署 支持海量数据

定义:定时任务是指系统为了自动完成特定任务,实时、延时、周期性完成任务调度的过程。分布式定时任务是把分散的、可靠性差的定时任务纳入统一的平台,并实现集群管理调度和分布式部暑的一种定时任务的管理方式。 按触发时机分类: ·定时任务:特定时间触发,比如今天15:06执行延时任务 ·延时触发,比如10s后执行 ·周期任务:固定周期时间,或固定频率周期调度触发,比如每隔5s或者每天12点执行

分布式定时任务-特点 ·自动化:全自动完成定时任务的调度和执行 ·平台化:基于平台化的思维管控一系列的分布式定时任务 ·分布式:在分布式系统环境下运行任务调度,突破单机定时任务的性能瓶颈 ·伸缩性:采用集群方式部署,可以随时按需扩缩容 ·高可用:单点故障不影响最终任务结果,可以做到故障转移

分布式定时任务-执行方式 子节踪动青训营社 ·单机任务:随机触发一台机器执行任务,适用于计算量小、并发度低的任务 ·广播任务:广播到所有机器上执行闷一个任务,比如所有机器-一起清理日志 ·Map任务: 一个任务可以分出多个子任务,每个子任务负责一部分的计算。适用于计算量大,单机无法满足要求的任务 ·MapReduce任务:在Map任务的基础上,还可以对所有子任务的结果做汇总计算,适用于计算量大,并且需要对子任务结果做汇总的任务

image.png

分布式定时任务VS单机定时任务 关系: 都可以实现自动化的定时、延时、周期任务调度 差异: ·分布式定时任务可支撑更大的业务体量 ·分布式定时任务的性能、伸缩性、稳定性更高

分布式定时任务VS大救据处理引擎 关系: ·都可以对海量数据做处理·性能、伸缩性、稳定性都很高差异: 定时并不是大数据处理引擎雯解决的 核心问题 大数据处理引擎往往致力于将源数据 处理成结果数据,分布式定时任务除了能做这个之外,还可以调用HTTP和RPC服务

image.png

3原理实现

三个关键问题: 触发器: Trigger,解析任务,生成触发事件 核心职责 ·给定一系列任务,解析它们的触发规则,在规定的时间点触发任务的调度 设计约束 ·需支持大量任务·需支持秒级的调度·周期任务需要多次执行 ·需保证秒级扫描的高性能,并避免资源浪费

调度器:Scheduler,分配任务,管理任务生命周期

image.png 执行器:Executor,获取执行任务单元,执行任务逻辑

image.png

数据流: image.png

功能架构

image.png

控制台: 任务:Job,任务元数据 任务实例:Joblnstance,周期任务会生成多个任务实例 任务结果:JobResult,任务实例运行的结果 任务历史:JobHistory.用户可以修改任务信息.任务实例对应的任务元数据可以不同.因而使用任务历史存储

小结: ·核心架构 ·控制台Admin、触发器Trigger、调度器Scheduler、执行器Executor 业务模型 ·任务元数据Job、任务实例oblnstance、任务结果JobResult、任务历史JobHisto 触发器 ·定时扫描+延时消息·时间轮 ·链表、最小堆、时间轮、多级时间轮 调度器 ·资源来源 ·资源调度:节点选择、任务分片、任务编排、故障转移 执行器 ·注册、调度、回调、心跳检测

4业务应用

image.png

image.png

image.png