kafka除了生产者、消费者模式,还有数据管道这种模式。
数据管道的特性
- 解除两端耦合
- 可靠性:要求消息至少一次传递
- 高吞吐量和动态吞吐量:数据管道需要支持非常高的吞吐量。更重要的是,在某些情况下,数据管道还需要能够应对突发的吞吐量增长
- 数据格式:数据管道需要协调各种数据格式和数据类型
- 转换:ETL,数据管道会处理数据;ELT:数据管道基本不会处理数据
- 安全性
- 故障处理能力
如何在数据管道模式、生产消费模式选择?
如果要将kafka连接到数据存储系统,可以使用connect,因为这些系统不是自己开发的,我们无法也不想修改他们内部代码。
kafka数据管道一般用来做什么
- 两个数据存储系统之间数据的转移:Mysql <-> ElasticSearch