分布式定时任务 | 青训营笔记

46 阅读4分钟

这是我参与「第五届青训营」伴学笔记创作活动的第 12 天

概述

本节课程主要分为五个方面:

  1. 分布式定时任务整体架构
  2. 控制台Admin详细设计
  3. 触发器Trigger详细设计
  4. 调度器Scheduler详细设计
  5. 执行器Executor详细设计

课前部分主要罗列课程中涉及到的概念。对于不熟悉的概念,同学们可以提前查询预习;课中部分主要罗列每一部分的关键思路,帮助同学们跟上课程的进度;课后部分是一些问题,帮助同学们在课后梳理本课程的重点。

课前

分布式定时任务发展历史

  • Linux命令-CronJob
  • 单机定时任务-Timer、Ticker
  • 单机定时任务-ScheduledExecutorService
  • 任务调度- Quartz
  • 分布式定时任务

分布式定时任务核心架构

  • 控制台Admin
  • 触发器Trigger
  • 调度器Scheduler
  • 执行器Executor

知识点扩充

  • 时间轮
  • 延时消息
  • 离线计算引擎 Hive
  • 实时计算引擎 Flink

课中

前言

  • 每年春节抖音都会有很多有意思的玩法,如果同学们是字节的后端同学,怎么设计今年春节集卡瓜分20亿的技术方案?

  • 业务流程

    • 定时扫描抖音用户集卡状态
    • 汇总计算用户的瓜分金额
    • 定时开奖
  • 技术体量

    • 亿级用户规模
    • 十亿级资金规模
    • 百万级读写QPS
  • 方案引出

    • 自动化 + 定时执行 + 海量数据 + 高效稳定 = 分布式定时任务

发展历程

发展历史

  • Linux命令-CronJob

  • 单机定时任务-Timer、Ticker

  • 单机定时任务-ScheduledExecutorService

  • 任务调度- Quartz

  • 分布式定时任务

  • 概述

    • 定义

      • 定时任务是指系统为了自动完成特定任务,实时、延时、周期性完成任务调度的过程。
      • 分布式定时任务是把分散的、可靠性差的定时任务纳入统一的平台,并实现集群管理调度和分布式部署的一种定时任务的管理方式。
    • 特点

    • 执行模式

      • 单机任务
      • 广播任务
      • Map任务
      • MapReduce任务
    • 现状

      • 业内流行框架
      • Xxl-jobSchedulerXTCTElastic-jobSaturn
        来源公司美团点评阿里巴巴腾讯当当网唯品会
        是否开源
        任务编排子任务依赖支持支持不支持不支持
        任务分片支持支持支持支持支持
        高可用支持支持支持支持支持
        故障转移支持支持支持支持支持
        可视化运维支持支持支持支持支持
      • 美团点评Xxl-job
      • 阿里巴巴SchedulerX
      • 腾讯TCT
  • 关联方案

    • 单机定时任务
    • 大数据处理引擎

实现原理

  • 整体架构

    • 核心架构

  • 数据流

  • 功能架构

控制台Admin

触发器Trigger

方案一:腾讯字节方案

定时扫描的机器集群部署,通过分布式锁保证只有一台在调度

方案二:Quartz方案——时间轮

调度器Scheduler

资源来源

  • 业务系统
  • 定时任务平台

执行器Executor

业务应用

  • 业务应用

    • 所有需要定时、延时、周期性执行任务的业务场景,都可以考虑使用分布式定时任
  • 知识面扩充

    • 分布式定时任务
    • 单机定时任务
    • 延时消息
    • 离线计算引擎Hive
    • 实时计算引擎Flink

总结

课后

  1. 分布式定时任务可以帮助我们处理哪些业务场景?
  2. 春节集卡瓜分20亿的玩法,发奖金额计算、实时开奖两个阶段分别用到分布式定时任务什么执行模式?
  3. 有了分布式定时任务,单机定时任务还有适用场景么?
  4. 时间轮这种数据结构,在定时/延时场景相比其他数据结构有哪些优势?
  5. 分布式定时任务的调度中心怎么判断一台执行器的机器处于可被调度状态?
  6. 你能想到哪些业务场景,实时计算引擎优于分布式定时任务?