这是我参与「第五届青训营 」笔记创作活动的第11天
例.春节集卡瓜分20亿
需求:
- 亿级用户规模
- 亿级资金规模
- 百万级读写QPS
- 自动化
- 定时执行
- 海量数据
- 高效稳定
实现: 分布式定时任务
cases
- case1:10分钟后电脑关机 ——.sh脚本
- case2:自动疫情打卡 ——win定时计划
- case3:每天 02:30定时清理机器日志 ——cron
- case4:每隔五分钟定时刷新本地缓存 ——go ticker
- case5:每隔五分钟定时执行多个任务 ——ScheduleExecutorService
任务调度最强工具-Quartz
特点:
- 单任务极致控制
- 没有负载均衡机制
分布式定时任务
特点:
- 平台化管理
- 分布式部署
- 支持海量数据
定义
分布式定时任务是指为了自动完成特定任务,实时、延时、周期性完成任务调度的过程
分布式定时任务是把分散的、可靠性差的定时任务纳入统一的平台,并实现集群管理调度和分布式部署的一种定时任务管理方式
按触发机制分类
- 定时任务:特点时间触发
- 延时任务:延迟触发
- 周期任务:固定周期时间或固定频率调度触发
执行方式
- 单机任务:随机触发一台机器执行任务,适用于计算量小、并发度低的任务
- 广播任务:广播到所有服务器上执行同一个任务,比如所有机器一起清理日志
- Map任务:一个任务分出多个子任务,每个子任务负责一部分计算,适用于计算量大,单机无法满足要求的情况
- MapReduce任务:在Map任务的基础上,还可以对所有子任务的结果进行汇总计算,适用于计算量大,并且需要对子任务结果进行汇总的任务
业内定时任务框架
知识面扩充
分布式定时任务VS大数据处理引擎
关系:
- 都可以对海量数据进行处理
- 性能、伸缩性、稳定性都很高
差异
- 定时并不是大数据引擎要解决的核心问题
- 大数据处理引擎往往致力于将源数据处理成结果数据,分布式定时任务除此之外,还可以调用HTTP和RPC服务