1、什么是kafka
- Apache Kafka 是一个开源的分布式流处理平台,支持开发实时、事件驱动的应用程序
- LinkedIn 于 2011 年开发了 Kafka 作为自己使用的高吞吐量消息中间件,然后将 Kafka 开源并捐赠给 Apache 软件基金会 2、基本概念
3、主要特性(设计目标)
- Kafka是一种分布式的,基于发布/订阅的消息系统
- 为生产者和消费者都提供了简单的API
- 高吞吐量
- 顺序读写
- 消费者指定偏移量
- 消费后不删除消息
- 横向扩容 4、在项目中的应用
- 数据管理
- 存储数据库库表结构等元数据变动
- ETL
- 离线/实时数据处理,存储采集的源端数据
- 日志