这是我参与「第三届青训营 -后端场」笔记创作活动的的第5篇笔记
今天主要记录的是分布式定时任务那些事儿之二
什么是分布式定时任务
定时任务是指系统为了自动完成特定任务,实时、延时、周期性完成任务调度的过程。
分布式定时任务是把分散的、可靠性差的定时任务纳入统一的平台,并实现集群管理调度和分布式部署的一种定时任务的管理方式。
按触发时机分类:
- 定时任务:特定时间触发,比如今天15:06执行
- 延时任务:延时触发,比如10s后执行
- 周期任务:固定周期时间,或固定频率周期调度触发,比如每天12点或者每隔5s执行
业内定时任务框架
- Xxl-job开源且免费,在中小型公司使用非常广泛
- SchedulerX,阿里巴巴内部广泛使用
- TCT,腾讯内部使用
分布式定时任务VS单机定时任务
- 分布式定时任务可支撑更大的业务体量
- 分布式定时任务的性能、伸缩性、稳定性更高
分布式定时任务VS大数据处理引擎
- 定时并不是大数据处理引擎需要解决的核心问题
- 大数据处理引擎往往致力于将源数据处理成结果数据,分布式定时任务除了能做这个之外,还可以调用HTTP和RPC服务
整体架构
分布式定时任务核心要解决触发、调度、执行三个关键问题
- 触发器:Trigger,解析任务规则,生成触发事件
- 调度器:Scheduler,分配任务,管理任务生命周期
- 执行器:Executor,获取执行任务单元,执行任务逻辑
除此之外,还需要提供一个控制台(Admin),提供任务管理和干预的功能。
触发器核心职责
- 给定一系列任务,解析触发规则,在规定的时间点触发任务的调度
触发器设计约束:
- 需支持大量任务
- 需支持秒级的调度
- 周期任务需要多次执行
- 需保证秒级扫描的高性能,并避免资源浪费
触发器-方案1
定期扫描+延时消息(腾讯、字节方案)
触发器-方案2
时间轮(Quartz方案)