【AllData数据中台】集成开源项目 DolphinScheduler,构建了可视化、高可靠的离线开发平台。
本文将完整演示Apache IOTDB数据同步到 Doris的全流程操作,从环境准备、数据源配置、任务流程编排,到任务执行调度、最终结果校验,全程采用简洁、可视化的配置方式,带你快速完成跨数据源数据同步。
共包含以下国内外开源组件:
1、开源项目
1.1 apache iotdb开源项目
1.2 apache dolphinscheduler开源项目
1.3 apache seatunnel开源项目
1.4 alldatacenter alldata开源项目
2、开源项目地址
一、环境准备
● iotdb 版本:1.3.0
● Doris 版本:doris-2.0.7
● SeaTunnel 版本:2.3.13
二、进入数据源管理平台
1、iotdb数据信息
2、创建Doris库表(无需操作,自动建表)
● 此时还未同步数据,doris中无相关表结构
三、进入离线开发平台
四、配置环境
1、打开安全中心
2、在左侧菜单选择环境管理
3、创建环境
● 配置 JDK
● 配置 SeatunnelServer
● 确定
五、创建任务
1、打开项目管理
2、创建项目
六、点击项目名称
1、打开工作流定义
2、创建工作流
● 找到数据集成 SEATUNNEL,拖拽到画板
● 填写必填项
● 页面下滑,找到脚本设置
● 加入以下脚本内容
env {
parallelism = 2
job.mode = "BATCH"
}
source {
IoTDB {
node_urls = "32g006:26667"
username = "root"
password = "root"
sql = "select status, hardware from root.ln.wf02.wt02"
schema {
fields {
ts = timestamp
status = boolean
hardware = string
}
}
}
}
sink {
Doris {
fenodes = "32g006:18030"
username = "root"
password = "123456"
database = "mydb"
table = "iotdb_result"
sink.label-prefix = "test_json"
sink.enable-2pc = "false"
sink.enable-delete = "true"
doris.config {
format = "json"
read_json_by_line = "true"
}
save_mode_create_template = """
CREATE TABLE IF NOT EXISTS `${database}`.`${table}` (
`ts` DATETIMEV2 NULL,
`status` BOOLEAN,
`hardware` STRING
) ENGINE=OLAP
DUPLICATE KEY(`ts`)
DISTRIBUTED BY HASH(`ts`) BUCKETS 8
PROPERTIES (
"replication_num" = "1"
)
"""
}
}
● 点击确定保存
3、保存工作流
● 创建完成
4、上线工作流
● 暂不配置定时任务,手动触发执行
5、运行工作流
6、打开工作流实例
● 查看工作流运行状态
● 执行完成
7、打开任务实例
● 可以看到任务执行完成
七、数据验证
1、同步数据前,查看Doris,没有数据库/表
2、同步数据后,查看Doris,自动创建mydb数据库,iotdb_result表
可快速实现IOTDB数据到Doris的离线同步全流程,打破IOTDB与Doris之间的数据孤岛,同时降低运维成本,提升数据处理效率。
✅️零代码编排: 拖拽组件即可完成同步任务,无需手写调度脚本和同步代码,降低开发成本;
✅️ 稳定可靠: 支持自动重试、告警,避免数据丢失和不一致,适合生产环境;
✅️ 全链路可视化: 任务执行状态、日志、数据流向全程可查,故障排查时间从几十分钟缩短到几分钟。
杭州奥零数据科技官网:www.aolingdata.com