kafka-构建数据管道

607 阅读1分钟

kafka除了生产者、消费者模式,还有数据管道这种模式。

数据管道的特性

  1. 解除两端耦合
  2. 可靠性:要求消息至少一次传递
  3. 高吞吐量和动态吞吐量:数据管道需要支持非常高的吞吐量。更重要的是,在某些情况下,数据管道还需要能够应对突发的吞吐量增长
  4. 数据格式:数据管道需要协调各种数据格式和数据类型
  5. 转换:ETL,数据管道会处理数据;ELT:数据管道基本不会处理数据
  6. 安全性
  7. 故障处理能力

如何在数据管道模式、生产消费模式选择?

如果要将kafka连接到数据存储系统,可以使用connect,因为这些系统不是自己开发的,我们无法也不想修改他们内部代码。

kafka数据管道一般用来做什么

  • 两个数据存储系统之间数据的转移:Mysql <-> ElasticSearch