DolphinScheduler 海豚调度

1,651 阅读1分钟
1/介绍
Apache DolphinScheduler(incubating)(简称 DS) 是一个Apache孵化器项目,
是由国内企业易观开源的大数据项目,是一个面向大数据应用的分布式工作流任务调度系统,之前叫EasyScheduler。
目前DS在国内已经有一定规模的用户基础,包括美团、平安、雪球等。

这里我们引用一下DS刚开源时的介绍:
   <1>相信做过数据处理的伙伴们对开源的调度系统如Oozie、Azkaban、Airflow应该都不陌生,
   <2>在使用这些调度系统中可能会有这样的体验:
        配置工作流任务不能可视化
        任务的运行状态不能实时在线查看
        任务运行时不能暂停、
        不能支持参数传递、
        不能补数、
        不能多租户使用、
        调度系统不高可用   
   <3>Easy Scheduler正是在这种背景下应运而生,其目标就是为使调度更加easy,更可以从其中文名“易调度”看出我们的初衷。
   
   
下图是一个跟Azkaban、Airflow的多方面对比:

image.png

2/DolphinScheduler创建项目和进程
   如果一切正常的话,浏览器打开 http://<host_name>:8888就会出现DS的登录界面,
   初始用户/密码为: admin/dolphinscheduler123。
   按照使用操作手册,先创建项目,再创建一个租户(tenant);租户就是运行任务的Linux用户。