消息队列原理与实战｜青训营笔记这是我参与「第五届青训营」伴学笔记创作活动的第 13 天消息队列引出：系统崩溃——

这是我参与「第五届青训营」伴学笔记创作活动的第 13 天

消息队列引出：

系统崩溃——>消息队列解耦
服务能力有限——>削峰
链路耗时太长——>异步
处理本地日志故障

定义：消息队列 (MQ) ，指保存消息的一个容器，本质是个队列。但这个队列呢，需要支持高吞吐，高并发，并且高可用。

kafka

Kafka是最初由Linkedin公司开发，是一个分布式、支持分区的（partition）、多副本的（replica），基于zookeeper协调的分布式消息系统。

常用的需求场景有：基于hadoop的系统、低延迟的实时系统、storm/Spark流式处理引擎，web/nginx日志、访问日志，消息服务等

kafka基础架构：

Producer：Producer即生产者，消息的产生者，是消息的入口。

Broker：Broker是kafka实例，每个服务器上有一个或多个kafka的实例，我们姑且认为每个broker对应一台服务器。每个kafka集群内的broker都有一个不重复的编号，如图中的broker-0、broker-1等……

Topic：消息的主题，可以理解为消息的分类，kafka的数据就保存在topic。在每个broker上都可以创建多个topic。 Partition：Topic的分区，每个topic可以有多个分区，分区的作用是做负载，提高kafka的吞吐量。同一个topic在不同的分区的数据是不重复的，partition的表现形式就是一个一个的文件夹！

Replication:每一个分区都有多个副本，副本的作用是做备胎。当主分区（Leader）故障的时候会选择一个备胎（Follower）上位，成为Leader。在kafka中默认副本的最大数量是10个，且副本的数量不能大于Broker的数量，follower和leader绝对是在不同的机器，同一机器对同一个分区也只可能存放一个副本（包括自己）。

Message：每一条发送的消息主体。

Consumer：消费者，即消息的消费方，是消息的出口。

Consumer Group：我们可以将多个消费组组成一个消费者组，在kafka的设计中同一个分区的数据只能被消费者组中的某一个消费者消费。同一个消费者组的消费者可以消费同一个topic的不同分区的数据，这也是为了提高kafka的吞吐量！

Zookeeper：kafka集群依赖zookeeper来保存集群的的元信息，来保证系统的可用性。

kafka的发送流程：

先从集群获取分区的leader
producer将消息发送给leader
leader将消息写入本地文件
follower从leader pull消息
follower将消息写入本地后向leader发送ACK
leader收到所有ack后向producer发送ACK

消息队列原理与实战｜ 青训营笔记

kafka

消息队列原理与实战｜青训营笔记