高效同步!AllData数据中台通过集成DolphinScheduler+Seatunnel实现SAP HANA数据库同步到Doris数据仓库

0 阅读3分钟

【AllData数据中台】集成开源项目 DolphinScheduler+Seatunnel,构建了可视化、高可靠的离线开发平台。

本文将完整演示 SAP HANA 数据同步到 Doris 的全流程操作,从环境准备、数据源配置、任务流程编排,到任务执行调度、最终结果校验,全程采用简洁、可视化的配置方式,带你快速完成跨数据源数据同步。

1、共包含以下国内外开源组件:

(1)此次同步的数据源是 SAP HANA 内存关系型数据库 SAP HANA 是一款高性能、列式存储的内存关系型数据库管理系统(In-Memory Database);

(2)将数据完全存储在内存中而非磁盘,速度比传统数据库快10到10,000倍;

(3)专为实时数据分析和处理企业级事务(OLTP/OLAP)而设计,是新一代 SAP S/4HANA ERP 系统的核心。

2、产品与项目地址

www.sap.cn/products/da…

github.com/apache/dolp…

github.com/apache/seat…

github.com/alldatacent…

1、环境准备

(1)SapHana 版本:2.00

(2)Doris 版本:doris-2.0.7

(3)SeaTunnel 版本:2.3.13

2、进入数据源管理平台

(1)查看saphana 数据信息 1.png

3、进入离线开发平台

2.png

4、配置环境

(1)打开安全中心 3.png

(2)在左侧菜单选择环境管理 4.png

(3)创建环境 5.png

(4)配置 JDK

(5)配置 SeatunnelServer

(6)确定

5、创建任务

(1)打开项目管理 6.png

(2)创建项目 7.png

6、点击项目名称

8.png

(1)打开工作流定义 9.png

(2)创建工作流-找到数据集成 SEATUNNEL,拖拽到画板 10.png

11.png

12.png

(3)填写必填项

(4)页面下滑,找到脚本设置

(5)加入以下脚本内容

env {
  parallelism = 1
  job.mode = "BATCH"
}

source {
  Jdbc {
    driver = com.sap.db.jdbc.Driver
    url = "jdbc:sap://32g003:39017"
    user = "SYSTEM"
    password = "Abcd1234"
    query = "SELECT EMPLOYEE_ID , NAME , DEPARTMENT  FROM employees"
  }
}

sink {
  Doris {
    fenodes = "32g006:18030"
    username = "root"
    password = "123456"
    database = "mydb"
    table = "saphana_result"
    sink.label-prefix = "test_json"
    sink.enable-2pc = "false"
    sink.enable-delete = "true"
    doris.config {
      format = "json"
      read_json_by_line = "true"
    }
  }
}

(6)点击确定保存

(7)保存工作流 13.png

14.png

(8)创建完成 15.png

(9)上线工作流 16.png

17.png

(10)暂不配置定时任务,手动触发执行 18.png

(11)运行工作流 19.png

20.png

(12)打开工作流实例 21.png

(13)查看工作流运行状态

(14)执行完成 22.png

(15)打开任务实例-可以看到任务执行完成 23.png

7、数据验证

(1)同步数据前,查看Doris,没有表 24.png

(2)同步数据后,查看Doris,自动创建saphana_result表 25.png

可快速实现 SAP HANA 内存关系数据库到 Doris 的离线同步全流程,打破SAP HANA与Doris之间的数据孤岛,同时降低运维成本,提升数据处理效率。

✅️ 零代码编排: 拖拽组件即可完成同步任务,无需手写调度脚本和同步代码,降低开发成本;

✅️ 稳定可靠: 支持自动重试、告警,避免数据丢失和不一致,适合生产环境;

✅️ 全链路可视化: 任务执行状态、日志、数据流向全程可查,故障排查时间从几十分钟缩短到几分钟。

杭州奥零数据科技官网:www.aolingdata.com