TiDB 混合负载场景下的 ETL 与 CDC 实践

0 阅读2分钟

在数字化转型深化阶段,企业数据架构面临交易与分析融合、实时一致性刚性需求等挑战。TiDB凭借HTAP架构在混合负载场景中开辟独特路径,而ETLCloud将ETL与CDC能力融为一体,提供高效的数据集成平台。本文将详细阐述如何基于ETLCloud构建从TiDB到SqlServer的高可靠、高性能数据通道,实现异构数据库的无缝拉通。

1.创建数据源链接

来到ETLCloud首页,找到数据源管理模块进入。

图片 1

首先创建TiDB的数据源

图片 2

配置完后点击保存并测试链接按钮测试数据库连通性,出现链接成功表示ETLCloud平台成功连通了TiDB数据库。

图片 3

本次示例演示要将源端TiDB的数据同步到SqlServer中,那么接下来配置一下SqlServer的数据源,配置方式同上,如果源端是其他类型的数据库可以自行选择对应的数据源组件进行配置。

图片 4

2.创建****监听器

配置完源端与目标端的数据源链接后,我们来配置监听器,来到首页,找到实时集成旗舰版模块。

图片 7

进入到创建流程的应用

图片 9

创建一个监听器

图片 10

监听器配置,配置tidb数据库要监听的表

图片 11

配置监听器数据传输的SqlServer目标表

图片 12

配置原表和目标表表名和字段名映射

图片 13

全量设计配置

图片 14

配置全量同步流程

图片 15

实时库表批量输入配置

图片 16

图片 17

cdc数据库映射配置

图片 19

图片 20

实时库表批量输出配置

图片 21

图片 22

3.启动监听器

全量+增量启动

图片 23

监听器启动完成,全量同步执行完成了,增量也启动了

图片 25

修改监听器监听的表数据,增量同步成功了

图片 26

从以上示例可以看出,ETLCloud为TiDB提供了零代码的异构数据实时集成能力,支持全量初始化与增量实时同步双模式,通过毫秒级数据延迟与秒级schema变更同步,自动完成历史数据迁移和实时变更捕获,同时大幅降低手动开发成本并提升数据管道构建效率。