开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第5天,点击查看活动详情
👨🎓作者:生无clean
🙏版权声明:文章里的部分文字或者图片来自于互联网以及百度百科,如有侵权请尽快联系小编。
☠️每日毒鸡汤:好的容貌和很多钱,是进入上流社交活动的通行证。
Kafka
1. Kafka概念
1.1 kafka定义
- kafka是一个 分布式 的基于 消息发布/订阅模式 的 消息队列,主要用于大数据实时处理领域。
1.2 消息队列
- 消息队列中间件是分布式系统中重要的组件,主要解决应用解耦,异步消息,流量削锋等问题,实现高性能,高可用,可伸缩和最终一致性架构。目前使用较多的消息队列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ。
- 生产大于号消费
1.3 使用消息队列的好处
- 解耦: 允许你独立的扩展或修改两边的处理过程,只要确保他们遵守同样的接口。以前在通信的时候。A系统和B系统必须实时的进行通信,有了消息队列的存在,A可以先把消息放到消息队列中,之后B系统想要数据的时候从消息队列中进行获取,这样A和B就不用同时的存在,完成解耦的操作。
- 可恢复性: 系统的一部分组件失效时,不会影响到整个系统。消息队列降低了进行之间的耦合度,所以即使一个处理消息的进程挂掉,加入队列中的消息仍然在系统恢复后被处理。
- 缓冲: 有助于控制和优化数据流经过系统的速度,解决生产消息和消费消息的处理速度不一致的情况。
- 灵活性和峰值处理能力: 在访问量剧增的情况下,应用仍然需要继续发挥作用,但是这样的突发流量并不常见。使用消息队列完全顶住突发的访问压力,而不会因为突发的超负荷的请求而完全崩溃。 削峰
- 异步通信: 这个作用和解耦是一样的。
1.4 消息队列的两种模式
- 点对点模式: 一对一消费者主动拉去数据, 消息收到后消息清除。消息生产者消息发送到Queue中,然后消息消费者从Queue中取出并且消费消息。消息被消费以后,queue中不再有存储,所以消费者不可能消费到已经被消费的消息。Queue支持存在多个消费者,但是对一个消息而言,只会有一个消费者可以消费。
- 发布/订阅模式: 一对多,消费者消费数据之后不会清除消息。消费者(发布)将消息发布到 topic 中,同时有多个消息消费者(订阅)消费该消息。和点对点的方式不同,发布到 topic 的消费被所有订阅者消费。
- 这个存储时间并不是永久保存,可以通过属性进行动态配置。
2. kafka基础架构
- Produce : 消息生产者,就是向 kafka broker 发消息的客户端。
- Consumer : 消息消费者,向 kafka broker 消费消息的客户端。
- Consumer Group(CG) : 消费者组,由多个 consumer 组成。消费者内每个消费者负责消费不同分区的数据,一个分区只能有由一个组内消费者消费;消费者之间互不影响。所有的消费者都属于某个消费者组,即消费是逻辑上的一个订阅者。
- Broker : 一台 Kafka 服务器就是一个 borker。一个集群由多个 broker 组成。一个 broker 可以容纳多个 topic。
- Topic :主题,可以理解为一个队列,生产者和消费者面向的都是一个 topic 。
- Partition: 为了实现扩展性,一个非常大的 topic 可以分布到多个 broker(即服务器上),一个topic可以分为多个 partition ,每个 partition 是一个有序的队列。
- Replica : 副本,为保证集群中的某个节点发生故障时,该节点上的 partition 数据不丢失,且 Kafka仍能继续工作,Kafka提供了副本机制,一个 topic 的每个分区都有若干个副本,一个leader和若干个 follower。
- leader : 每个分区多个分区的 ”主“,生产者发送数据的对象,以及消费者消费数据的对象都是 leader。
- followre : 每个分区多个副本中的 ”从“。实时从 leader 中同步数据,保持和leader数据的同步。leader发生故障时,某个 follower 会成为新的 leader。