Kafka

使用Kafka流程：

创建集群->新增Topic->编写生产者逻辑->编写消费者逻辑

基本概念：

Topic：逻辑队列，不同的业务场景就是不同的Topic

Cluster：物理集群，每个集群可以建立不同的Topic

Produce、Consumer：将消息发送到队列中，从队列中取消息

ConsumerGroup：消费者组

offset：消息在partition内的相对位置，可以理解为唯一的ID，在partition内部严格递增

Replica：每个分片有多个副本，Leader Replica将会从ISR中选出。

Follower会不断从Leader上拉取数据下来

数据复制

架构

ZooKeeper：与Controller一起存储元数据信息等

写入流程：

Producer将多个消息写入Batch中，批量发送增加吞吐量，然后进行压缩，发给Broker（在消息队列中），然后等待Broker返回是否写入成功

Broker消息文件结构：

Broker写入消息时采用顺序写的方式，提高写入效率

Consumer通过发送FetchRequest请求数据消息，Broker会将指定Offset处的消息，按照时间窗口和消息大小窗口发送给Consumer

具体找offset偏移量的文件：

通过二分查找找到对应的三个文件

数据复制：Broker零拷贝：直接将数据发送到NIC Buffer，减少内存拷贝次数

ConsumerGruop的分配方式：每一Group将所有Partition全拷贝

缺点：

BMQ

兼容Kafka协议，存算分离（Broker上存储的数据用另外一个存储机构存储），云原生消息队列

架构图

对于运维来说，重启、替换、扩容、缩容都可以在秒级完成

写文件流程：

文件结构对比：

后面看不懂了