Kafka 学习笔记
概要
- kafka 是是一个分布式提交日志平台,或者说是分布式流平台
- 按照一定顺序持久化保存
- 具备数据故障保护和性能伸缩能力
为了提高效率,消息是分批发送的。
分批
生产者 默认生产者将消息均匀的分不到topic下所有的分区上,也可以通过指定的方式发布在特定的分区上。 指定分区: 消息的键,自定义分区器
消费者 消费者通过消息的偏移量,偏移量保存在Zookeeper 或者 Kafka 上。消费者集群中的一个节点只能和一个分区绑定消费
Broker 和集群
- 接受消息
- 为消息设置偏移量
- 保存到磁盘
- 为消费者提供消息
集群控制器,自动从活跃的broker中选举出来,负责管理工作,包括将分区分配给broker、自动监控功能
分区首领 分区复制
保留时间:时间、一定大小