后端消息队列原理与实践 day16 | 青训营笔记这是我参与「第五届青训营」伴学笔记创作活动的第 16 天今日笔记

这是我参与「第五届青训营」伴学笔记创作活动的第 16 天

今日笔记内容: 消息队列原理与实践

消息队列的应用案例

消息队列(MessageQueue), 指保存消息的一个逻辑队列, 需要支持高吞吐, 高并发与高可用

发展历程

Kafka

分布式, 分区, 多副本的日志提交服务, 高吞吐场景下表现出色

使用场景

Kafka基本概念

![[Pasted image 20230209123952.png]]

kafka集群依赖ZooKeeper做集群管理, 存储集群的元信息

Kafka的高吞吐架构

Producer发送
- 批量发送
- 消息压缩
Broker的存储架构
- 末尾添加, 顺序写
- /Topic/Partition/Segment/(log|index|tiemindex)
- 消息索引
- SendFile系统调用0拷贝, 直接将文件内容发送到网卡
Consumer消费组织
- Lov-Level:手动分配: 不够灵活
- Hight-Level: 节点变更, 自动负载均衡

文件组织: Segment是存储日志数据的基本文件单元, 每个Segment以存储的第一个日志的offset命名, 包含.log, .index, .timeIndex 三个文件, 通过二分查找找到小于offset的最大文件, 查找其日志内容

日志拷贝带来的问题: 节点重启, 集群节点变更出现时, 需要同步拷贝缺失的日志问题, 且为了保证集群的高可用, 拷贝的并发度不能设置太高, 导致耗时增加. Partition负载不均衡, 需要切换不同节点时, 也会面临同样问题问题总结:

支持kafka协议, 存算分离架构, 云原生消息队列 ![[Pasted image 20230209175721.png]]

通过引入Proxy层, 大大降低了运维操作的耗时

低延迟, 强一致性, 高性能, 高可靠, 万亿级别容量和灵活的可拓展性, 在一些实时场景中运用较广

存储模型: 所有消息存储到一个CommitLog中, 根据不同的Queue加入到对应ConsumerQueue

高级特性: