消息队列｜青训营笔记这是我参与「第五届青训营」伴学笔记创作活动的第 7 天。今天学习了消息队列的相关知识，了解了k

这是我参与「第五届青训营」伴学笔记创作活动的第 7 天

本次了解了消息队列的底层原理架构等等

四个场景：

系统奔溃

如果因为服务器宕机导致本地日志丢掉了，要怎么处理。

这里引入消息队列进行解耦，即使这里的存储服务发生故障，这里的消息也会存储到消息队列中。
服务处理能力有限

引入消息队列来进行削峰
链路耗时长尾

挺有意思的，就是使用消息队列存储，使得同一个任务能够被不同的对象消费，这样就能够异步地执行这个任务了（不过这里执行一致性似乎需要保证，比如中间有一个环节出错了，那应该还是需要整体回滚）
日志如何处理

消息队列(MQ)，指保存消息的一个容器，本质是个队列。但这个队列呢，需要支持高吞吐，高并发，并且高可用。

业界消息队列对比：

如果发送一条消息，等到其成功后再发一条会有什么问题? 显然发送能力不够，所以有了批量发送，批量发送可以减少IO次数，从而加强发送能力
但还有一个问题，如果单个信息的量很大，而且此时并发和吞吐都很大，此时带宽不够用怎么办？此时引出了数据压缩，通过压缩，减少消息大小，目前支持Snappy、 Gzip、 LZ4、ZSTD压缩算法。

partition的副本最终都以日志的形式写入到磁盘中

对于一个log 会切分成多个logSegment（有顺序的）

然后单个logSegment组成就是：

上面索引的文件命名似乎是按照每一个segment的索引开始数字来记录的

Broker-磁盘结构移动磁头找到对应磁道，磁盘转动，找到对应扇区，最后写入。寻道成本比较高，因此顺序写可以减少寻道所带来的时间成本。

Consumer通过发送FetchRequest请求消息数据，Broker 会将指定Offset处的消息，按照时间窗口和消息大小窗口发送给Consumer,寻找数据这个细节是如何做到的呢?

偏移量索引查找

二分找到小于目标offset的最大文件（根据上面的命名规则来的)

索引是稀疏索引
时间戳索引文件

二分找到小于目标时间戳最大的索引位置，在通过寻找offset的方式找到最终数据。

其实就是一个二级索引，这里先根据时间戳找到offset，再根据offset找到对应的postion

消息队列 ｜ 青训营笔记