SnailJob - 分布式任务重试与调度平台

707 阅读5分钟

1. 简介

1 . 1 项目介绍

SnailJob是一个高效且可靠的开源分布式任务重试和任务调度平台,旨在解决复杂分布式环境中的任务执行问题。它的设计灵感源于对高可用性、灵活性和性能的追求,能够帮助企业提升分布式业务系统的整体一致性。通过SnailJob,您可以轻松创建、管理和监控可重试或定时执行的任务,确保业务流程的顺畅进行。

开源地址:gitee.com/aizuda/snai…

1 . 2 核心功能

  • 可重放的任务:支持任务结果的记录和回溯,便于调试和排查问题。

  • 智能重试策略:自动处理失败任务,可根据预设策略进行重试,减少手动介入。

  • 分布式任务调度:提供秒级精确定时任务调度,并支持任务中断和编排,满足不同场景需求。

  • 权限管理:完善的权限控制机制,确保操作安全。

  • 告警监控:实时监控任务状态,异常时及时报警,保障业务稳定运行。

1 . 3 开源组件对比

图片


2. 常用注解

2 . 1 *Retryable注解

图片

图片


2 . 2 ExecutorMethodRegister注解

图片


2 . 3 JobExecutor注解

图片


3. 部署与试用

3 . 1 搭建数据库环境

Snail Job支持多种数据库,其中包含Mysql、Mariadb、Postgres、Oracle、MS SQL Server、达梦等。可以执行sql脚本生成相关表结构也可以使用 docker compse快速构建数据库环境。

以使用docker搭建数据库环境为例,打开拉下来的项目代码

cd ./doc/docker

*## 启动 mysql

docker compose up -d mysql

3 . 2 服务端配置

服务端代码整体目录结构如图所示:

图片

在snail-job-server-sater启动服务端程序application.yml 常用配置

图片

3 . 3 客户端配置

图片

注:在启动多个客户端时要配置客户端端口,否则会报地址被占用,在集群模式下只会有一个服务正常访问

3 . 4 服务端web界面

服务端启动后,默认访问地址为:http://127.0.0.1:8080/snail-job/

图片

3 . 5 定时任务配置

图片

点击新增新建一个新的定时任务

图片

图片

组名称:组是一个逻辑概念, 它可以看做是场景的分类或者是标签, 用于将一些相关性的场景进行分组,可以理解为MQ的Topic和Queue的关系; 服务端的负载均衡也是基于组 把不同的组分配到不同的服务端集群的其中一个节点。

图片

客户端的group为已经配置好的组名

执行器名称:执行任务的方法名称

图片

任务类型

  • 集群模式: 当客户端部署节点数>=1时,同一时间只会在一个节点执行任务,确保任务的单一执行性。
  • 广播模式: 每次任务触发时,所有活跃的客户端都会执行一次任务,实现任务的广泛触达和执行。
  • 分片模式: 按照预定的分片数量,轮询地将任务依次下发给活跃的客户端,实现任务的分布式处理和优化执行。

路由策略

  • 轮询: 轮询路由策略是一种简单而有效的方法,按照顺序依次将任务分发给不同的节点,确保任务在集群中平均分布,达到负载均衡的效果。
  • 一致性Hash: 一致性Hash路由策略基于哈希函数,将任务和节点映射到一个固定的哈希环上。这样,当有新的节点加入或节点离开时,只需重新计算少量的映射关系,而不会影响到大部分任务的分配。这种策略保持了相对的稳定性和负载均衡。
  • 随机: 随机路由策略是将任务随机分配给集群中的一个节点。每次任务触发时,系统会随机选择一个节点来执行任务。尽管简单,但也具有一定的负载均衡效果,适用于某些场景下的随机化需求。
  • LRU (Least Recently Used): LRU路由策略基于最近使用的原则,将任务分配给最近最少被使用的节点。这种策略保持了节点的活跃性,避免任务集中在某个节点上执行,从而提高系统的性能和稳定性。

阻塞策略

  • 丢弃策略: 丢弃策略是一种简单的阻塞策略,当处理速度无法跟上任务批次的产生速度时,新产生任务批次将被直接丢弃,从而保持系统的稳定性。
  • 覆盖策略: 覆盖策略是指当新的任务批次产生时,如果上一个任务批次仍在处理中,将产生一个新的批次覆盖掉正在处理的批次,系统开始处理新的批次。
  • 并行策略: 并行策略允许系统同时处理多个批次,无需等待前一个批次处理完成。这种策略可以提高系统的处理能力,但需要考虑线程安全和资源竞争等问题。

我们配置的为切片类型,因此在配置完定时任务后,我们启动两个不同端口的客户端,分组名为job_demo,点击执行该定时任务,两个客户端会收到不同的分片参数,如图所示

图片

图片

3 . 6 工作流

可以通过工作流执行定时任务,以上文的切片任务为例

图片

图片

图片

在创建完定时任务后,客户端以十秒一次执行切片任务,结果如下图所示

图片

图片