【新功能重磅发布】AllData数据中台基于开源项目DBSwitch一键搞定表结构迁移!

132 阅读5分钟

🔥🔥 AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为中层框架,以大模型应用为上游产品,提供全链路数字化解决方案。

✨杭州奥零数据科技官网:www.aolingdata.com

✨AllData开源项目:github.com/alldatacent…

✨Gitee组织:gitee.com/alldatacent…

摘要:AllData数据中台商业版集成开源项目DBSwitch后,可保障数据迁移与访问的高效稳定,降低企业多数据库汇聚入湖仓成本,提升系统兼容性与可扩展性。文章内容主要为以下三部分:

一、功能介绍

二、技术特性

三、访问数据库同步平台页面演示

💡Tips:关注「公众号」大数据商业驱动引擎

1.jpg

数据库同步平台基于开源项目DBSwitch建设 

DBSwitch是款开源数据库迁移工具,支持多种主流及国产数据库间的全量与增量迁移,涵盖表结构同步与数据同步,采用模块化设计,具备高扩展性与灵活性,可保障数据迁移与访问的高效稳定,降低企业多数据库汇聚入湖仓成本,提升系统兼容性与可扩展性。

DBSwitch项目地址:gitee.com/inrgihc/dbs…

 数据库同步平台(公众号).jpg

2 拷贝 2.jpg

DBSwitch

工具提供源端数据库向目的端数据库的离线批量迁移同步功能,支持数据的全量/增量/变化量方式同步。

结构迁移

  • 支持字段类型、主键信息、建表语句等的转换,并生成建表SQL语句;
  • 支持基于正则表达式转换的表名与字段名映射转换。

数据同步

全量迁移:

  • 基于JDBC的分批次离线读取源端数据库数据;

  • 并基于insert/copy方式将数据分批次写入目的数据库。

增量同步

  • 支持指定增量标识字段的增量同步(适用于日志表等存在增量标识字段的同步场景);
  • 支持有主键表的 变化量同步 (变化数据计算Change Data Calculate)功能(千万级以上数据量的性能尚需在生产环境验证)。

定时调度 

  • 内置 CronJob 定时任务引擎,支持手动触发或自动化调度,满足周期性数据同步场景。

技术特点 

多数据库支持

  • 覆盖RDBMS/Olap数据库:MySQL、Oracle、SQL Server、PostgreSql、DB2、Sybase、Hive、Sqlite3、ClickHouse、MongoDB、ElasticSearch、StarRocks、GreenPlum、Doris、TDEngine 等主流数据库。

  • 支持国产数据库:达梦数据库,人大金仓数据库,神通数据库,南大通用数据库,瀚高数据库,Gauss数据库, OceanBase数据库。

image.png

高效数据写入

  • 通过二进制协议与批量操作优化写入性能,减少网络与 I/O 开销。

灵活扩展性

  • 模块化设计支持快速适配新数据库或定制功能,如新增方言实现或写入优化。

2.jpg

系统概览
可一键呈现多数据库连接状态、迁移任务进度及系统资源占用等关键信息。 1_系统概览.jpg

数据源

支持多类型数据库接入,可便捷配置管理,保障数据稳定高效同步。 2_数据源.jpg

数据源-测试 3_数据源-测试.jpg

数据源-编辑  4_数据源-编辑.jpg

数据源-编辑-更新  5_数据源-编辑-更新.jpg

数据源-详情 6_数据源-详情.jpg

数据源-详情测试成功  7_数据源-详情测试成功.jpg

数据源-创建数据源 

支持多类型数据库参数配置,一键快速接入,实现高效数据交互。 8_数据源-创建数据源.jpg

驱动配置 

可灵活管理多数据库驱动,支持上传、加载与更新,保障连接稳定。 9_驱动配置.jpg

驱动配置-添加  10_驱动配置-添加.jpg

数据导航-元数据-基本信息

可直观展示表结构、字段等核心信息,助力数据管理。 11_数据导航-元数据-基本信息.jpg

数据导航-元数据-字段信息

数据导航的元数据字段信息功能,能清晰呈现字段名称、类型、长度等详情,辅助精准掌握数据特征。 12_数据导航-元数据-字段信息.jpg

数据导航-元数据-索引信息 

可快速检索不同数据源的索引详情,展示索引结构、关联字段等关键信息,助力高效管理数据索引,优化数据查询性能。 13_数据导航-元数据-索引信息.jpg

数据导航-元数据-取样信息

可按需抽取数据样本,展示字段值分布等关键信息,辅助用户快速了解数据特征与质量情况。! 14_数据导航-元数据-取样信息.jpg

数据导航-SQL在线

SQL在线功能支持多数据源的SQL查询与执行,提供语法高亮、自动补全及结果可视化展示,助力用户高效完成数据探索与分析任务。 15_数据导航-SQL在线.jpg

任务管理

支持多类型数据库同步任务的创建、配置与调度,提供任务状态监控、执行日志查看及异常告警,助力用户高效管理数据同步流程,保障数据迁移的稳定性和可靠性。

16_任务管理.jpg

任务管理-日志  17_任务管理-日志.jpg

任务管理-启动  18_任务管理-启动jpg.jpg

任务管理-执行成功  19_任务管理-执行成功.jpg

任务管理-详情 20_任务管理-详情.jpg

任务管理-创建任务-基本信息配置 21_任务管理-创建任务-基本信息配置.jpg

任务管理-创建任务-同步源端配置 22_任务管理-创建任务-同步源端配置.jpg

任务管理-创建任务-目标端配置 23_任务管理-创建任务-目标端配置.jpg

任务管理-创建任务-映射转换配置  24_任务管理-创建任务-映射转换配置.jpg

任务管理-创建任务-配置确认提交  25_任务管理-创建任务-配置确认提交.jpg

监控调度

可实时监控数据源连接状态与任务执行情况,支持定时调度与依赖调度,确保数据同步任务按计划稳定运行,并提供异常告警与日志记录,助力高效运维。 26_监控调度.jpg

监控调度-查看日志详情 27_监控调度-查看日志详情.jpg

操作日志

操作日志功能可完整记录数据同步任务执行过程中的关键操作,包括任务启动、停止、异常等状态变更,助力用户实时监控任务进度,快速定位并解决潜在问题。 28_操作日志.jpg