高效同步!离线开发平台(DolphinScheduler) 实现Apache IotDB物联网数据同步到 Doris

6 阅读2分钟

【AllData数据中台】集成开源项目 DolphinScheduler,构建了可视化、高可靠的离线开发平台。

本文将完整演示Apache IOTDB数据同步到 Doris的全流程操作,从环境准备、数据源配置、任务流程编排,到任务执行调度、最终结果校验,全程采用简洁、可视化的配置方式,带你快速完成跨数据源数据同步。

共包含以下国内外开源组件:

1、开源项目

1.1 apache iotdb开源项目

1.2 apache dolphinscheduler开源项目

1.3 apache seatunnel开源项目

1.4 alldatacenter alldata开源项目

2、开源项目地址

2.1 github.com/apache/iotd…

2.2 github.com/apache/dolp…

2.3 github.com/apache/seat…

2.4 github.com/alldatacent…

一、环境准备

● iotdb 版本:1.3.0

● Doris 版本:doris-2.0.7

● SeaTunnel 版本:2.3.13

二、进入数据源管理平台

1、iotdb数据信息

1.png

2、创建Doris库表(无需操作,自动建表)

● 此时还未同步数据,doris中无相关表结构

2.png

三、进入离线开发平台

3.png

四、配置环境

1、打开安全中心 4.png

2、在左侧菜单选择环境管理 5.png

3、创建环境 6.png

● 配置 JDK

● 配置 SeatunnelServer

● 确定

五、创建任务

1、打开项目管理 7.png

2、创建项目 8.png

六、点击项目名称

9.png

1、打开工作流定义

10.png

2、创建工作流

● 找到数据集成 SEATUNNEL,拖拽到画板

11.png

12.png

13.png

● 填写必填项

● 页面下滑,找到脚本设置

● 加入以下脚本内容


env {
  parallelism = 2
  job.mode = "BATCH"
}

source {
  IoTDB {
    node_urls = "32g006:26667"
    username = "root"
    password = "root"
    sql = "select status, hardware from root.ln.wf02.wt02"
    schema {
      fields {
        ts = timestamp
        status = boolean
        hardware = string
      }
    }
  }
}

sink {
  Doris {
    fenodes = "32g006:18030"
    username = "root"
    password = "123456"
    database = "mydb"
    table = "iotdb_result"
    sink.label-prefix = "test_json"
    sink.enable-2pc = "false"
    sink.enable-delete = "true"
    doris.config {
      format = "json"
      read_json_by_line = "true"
    }
    save_mode_create_template = """
      CREATE TABLE IF NOT EXISTS `${database}`.`${table}` (
        `ts` DATETIMEV2 NULL,
        `status` BOOLEAN,
        `hardware` STRING
      ) ENGINE=OLAP
      DUPLICATE KEY(`ts`)
      DISTRIBUTED BY HASH(`ts`) BUCKETS 8
      PROPERTIES (
        "replication_num" = "1"
      )
    """
  }
}

● 点击确定保存

3、保存工作流

14.png

15.png

● 创建完成

16.png

4、上线工作流

17.png

18.png

● 暂不配置定时任务,手动触发执行

19.png

5、运行工作流

20.png

21.png

6、打开工作流实例

22.png

● 查看工作流运行状态

● 执行完成

23.png

7、打开任务实例

24.png

● 可以看到任务执行完成

七、数据验证

1、同步数据前,查看Doris,没有数据库/表

25.png

2、同步数据后,查看Doris,自动创建mydb数据库,iotdb_result表

26.png

可快速实现IOTDB数据到Doris的离线同步全流程,打破IOTDB与Doris之间的数据孤岛,同时降低运维成本,提升数据处理效率。

✅️零代码编排: 拖拽组件即可完成同步任务,无需手写调度脚本和同步代码,降低开发成本;

✅️ 稳定可靠: 支持自动重试、告警,避免数据丢失和不一致,适合生产环境;

✅️ 全链路可视化: 任务执行状态、日志、数据流向全程可查,故障排查时间从几十分钟缩短到几分钟。

杭州奥零数据科技官网:www.aolingdata.com