分布式定时任务 | 青训营笔记

238 阅读4分钟

这是我参与「第五届青训营」伴学笔记创作活动的第 12 天

消息队列是什么

  • 解耦
  • 削峰
  • 异步
  • 日志处理

消息队列的前世今生

消息队列-Kafka

kafka使用场景,业务日志、用户行为数据、Metrics数据

基本概念,Producer、Cluster、Consumer、Topic、Partition

数据迁移、Offset、Partition选主

一条消息从生产到消费是如何处理的,Producer端逻辑、Broker端逻辑、Consumer端逻辑

消息队列-BMQ

Kafka在使用中遇到问题

BMQ架构

BMQ各模块是如何工作的,Broker、Proxy、HDFS、MetaStorage

BMQ多机房容灾

消息队列-RocketMQ

RocketMQ使用场景

RocketMQ和Kafka对比

RocketMQ架构介绍,Producer、Broker、Nameserver、Consumer

一条消息从生产到消费是如何处理的,Producer端逻辑、Broker端逻辑、Consumer端逻辑

消息队列在字节

一些最佳实践的场景,包括数据展示

本节课程主要分为五个方面:

  1. 分布式定时任务整体架构
  2. 控制台Admin详细设计
  3. 触发器Trigger详细设计
  4. 调度器Scheduler详细设计
  5. 执行器Executor详细设计

课前部分主要罗列课程中涉及到的概念。对于不熟悉的概念,同学们可以提前查询预习;课中部分主要罗列每一部分的关键思路,帮助同学们跟上课程的进度;课后部分是一些问题,帮助同学们在课后梳理本课程的重点。

分布式定时任务发展历史

  • Linux命令-CronJob
  • 单机定时任务-Timer、Ticker
  • 单机定时任务-ScheduledExecutorService
  • 任务调度- Quartz
  • 分布式定时任务

分布式定时任务核心架构

  • 控制台Admin
  • 触发器Trigger
  • 调度器Scheduler
  • 执行器Executor

知识点扩充

  • 时间轮
  • 延时消息
  • 离线计算引擎 Hive
  • 实时计算引擎 Flink

前言

  • 每年春节抖音都会有很多有意思的玩法,如果同学们是字节的后端同学,怎么设计今年春节集卡瓜分20亿的技术方案?
  • 业务流程

    • 定时扫描抖音用户集卡状态
    • 汇总计算用户的瓜分金额
    • 定时开奖
  • 技术体量

    • 亿级用户规模
    • 十亿级资金规模
    • 百万级读写QPS
  • 方案引出

    • 自动化 + 定时执行 + 海量数据 + 高效稳定 = 分布式定时任务

发展历程

  • 发展历史

    • Linux命令-CronJob

    • 单机定时任务-Timer、Ticker

    • 单机定时任务-ScheduledExecutorService

    • 任务调度- Quartz

    • 分布式定时任务

  • 概述

    • 定义

      • 定时任务是指系统为了自动完成特定任务,实时、延时、周期性完成任务调度的过程。
      • 分布式定时任务是把分散的、可靠性差的定时任务纳入统一的平台,并实现集群管理调度和分布式部署的一种定时任务的管理方式。
    • 特点

    • 执行模式

      • 单机任务
      • 广播任务
      • Map任务
      • MapReduce任务
    • 现状

      • 业内流行框架

        Xxl-jobSchedulerXTCTElastic-jobSaturn
        来源公司美团点评阿里巴巴腾讯当当网唯品会
        是否开源
        任务编排子任务依赖支持支持不支持不支持
        任务分片支持支持支持支持支持
        高可用支持支持支持支持支持
        故障转移支持支持支持支持支持
        可视化运维支持支持支持支持支持
      • 美团点评Xxl-job

      • 阿里巴巴SchedulerX

      • 腾讯TCT

  • 关联方案

    • 单机定时任务
    • 大数据处理引擎

实现原理

  • 整体架构

    • 核心架构

    • 数据流

    • 功能架构

  • 控制台Admin

  • 触发器Trigger

    • 方案一:腾讯字节方案

    • 方案二:Quartz方案——时间轮

  • 调度器Scheduler

    • 资源来源

      • 业务系统
      • 定时任务平台
  • 执行器Executor

业务应用

  • 业务应用

    • 所有需要定时、延时、周期性执行任务的业务场景,都可以考虑使用分布式定时任务
  • 知识面扩充

    • 分布式定时任务

    • 单机定时任务

    • 延时消息

    • 离线计算引擎Hive

    • 实时计算引擎Flink