【Kafka】核心原理（二）Kafka 底层数据结构存储 Kafka 底层数据存储以 partition 日志文件存储。

持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第4天，点击查看活动详情

Kafka 底层数据存储以 partition 日志文件存储。

Kafka 通过 NIO 的 ByteBuffer 将消息以二进制形式存储到 partition 日志中，二进制形式相对 Java 对象要节约近40%的空间：

假如一个 Topic 的数据大小为 TB 级别，不可能将 TB 级别数据存储到一台 Kafka Broker 机器上：

partition写入与消费.gif

高可用：就是多副本冗余。

每个分区 partition 有多个副本：

当一个 Kafka 进程宕机了，会根据情况重新选举一个 leader partition。

完整流程如下：

partition高可用.png

Kafka 保证数据不丢失，采用了 ISR(In-sync replicas)列表机制：

ISR 列表构成：每个 leader partition 中有一个 ISR 列表，里面至少有一个 follower

如果一个 leader 里面的 ISR 列表没有 follower ，是不允许其他应用往 Kafka 写数据
写成功标识：一条数据写入 leader partition，并将数据同步给其下的 ISR 列表中所有 follower
leader 选举：当 leader partition 所在 broker 机器宕机了，通过 ZK 进行 leader 选举，只能从 ISR 列表里选举新的 leader。

通过将 leader partition 分布在不同的机器上来实现请求负载均衡：

Kafka Broker 维护的元数据存储在 ZK 中，扩容时，只需从 ZK 中读取数据即可。

每个 Kafka Broker 都会将其元信息注册在 ZK 上，通过 ZK 可以：

【Kafka】核心原理（二）