走进消息队列 | 青训营走进消息队列前言：消息队列可以解决以下问题：系统崩溃通过引入消息队列，进行解耦服务处理

走进消息队列

前言：

消息队列可以解决以下问题：

系统崩溃

通过引入消息队列，进行解耦
服务处理能力有限

通过削峰以减少请求
链路耗时长尾

采用异步的方案，同时处理处理
日志处理

消息队列的定义

消息队列是指保存信息的一个容器，它本质是一个队列。但这个队列需要支持高吞吐，高并发，并且高可用

一、前世今生：消息队列发展历程

业界流行的MQ如下：

Kafka：分布式、分区的、多副本的日志提交服务，在高吞吐场景下发挥较为出色
RocketMQ：低延迟、强一致、高性能、高可靠、万亿级容量和灵活的可拓展性，在一些实时场景中运用较广
Pulsar：是下一代云原生分布式消息流平台，集消息、存储、轻量化函数式计算为一体、采用存算分离的架构设计
BMQ：和Pulsar架构类似，村算分离，初期定位是承接高吞吐的离线业务场景，逐步替换掉对应的Kafka集群

二、Kafka

使用场景

搜索服务、直播服务、订单服务、支付服务、用户行为（搜索、点赞、评论、收藏）
如何使用Kafka

创建集群->新增Topic->编写生产者逻辑->编写消费者逻辑
基本概念

Topic：逻辑队列，不同Topic可以建立不同的Topic

Cluster：物理集群，每个集群中可以建立多个不同的Topic

Producer：生产者，负责将业务消息发送到Topic中

Consumer：消费者，负责消费Topic中的消息

ConsumerGroup：消费者组，不同组Consumer消费进度互不干涉

Offset：消息在partition内的相对位置信息，可以理解为唯一ID，在partition内部严格递增

Replica：每个分片有多个Replica，Leader Replica将会从ISR中选出

ZooKeeper:负责存储集群元信息，包括分区分配信息等

4.一条消息的自述

Producer->生产->Broker->消费->Consumer

5.Producer-批量发送

批量发送可以减少IO次数，从而加强发送能力

6.Producer-数据压缩

通过压缩，减少消息大小，目前支持Snappy、Gzip、LZ4、ZSTD压缩算法

7.Broker-数据的存储

Broker->Batch->本地磁盘

8.消息文件结构

9.Broker-磁盘结构

移动磁头找到对应磁道，磁盘转动，找到对应扇区，最后写入。寻道成本较高，因此顺序写可以减少寻道所带来的实践成本

Consumer通过发送FetchRequest请求消息数据，Broker会将指定Offset处的消息，按照时间窗口和消息大小窗口发送给Consumer

11.Consumer-消息的接收端

12.Consumer-Low Level

通过手动进行分配，哪一个Consumer消费哪一个Partition完全由业务来决定

13.Consumer-High Level

14.Kafka-问题总结

运维成本高

对于负载不均衡的场景，解决方案复杂

没有自己的缓存，完全依赖Page Cache

Controller和Coordinator和Broker在同一个进程中，大量IO会造成其性能下降

三、BMQ

简介

兼容kafka协议，存算分离，云原生消息队列

运维操作对比

写文件流程

由Client写入到DataNode，然后读取到Client中

甬道消息的开发流程

开发->BOE->PPE->Prod

Databus的作用

简化消息队列客户端复杂度

解耦业务与Topic

缓解集群压力，提高吞吐

四、RocketMQ

使用场景

针对电商业务线，其业务涉及广泛，如注册、订单、库存、物流等；同时也会涉及许多业务峰值时刻，如秒杀活动、周年庆、定期特惠等

RocketMQ基本概念

高级特性

最终一致性