消息队列 | 青训营笔记

83 阅读3分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 11 天

消息队列的前世今生

什么是消息队列

消息队列(MQ):指保存消息的一个容器,本质是个队列。但这个队列需要支持高吞吐,高并发,并且高可用。

image.png

消息队列发展历程

  • TIB 1985年诞生,服务于金融机构和新闻机构
  • IBM MQ/WebSphere 1993年诞生,商业消息队列平台市场主要玩家
  • MSMQ 1997年微软发布
  • JMS 2001年诞生,本质上是一套Java API
  • AMQP/RabbitMQ 2004年规范发布,同年RabbitMQ面市
  • Kafka 2010年由Linked开源
  • RocketMQ 2011年案例中间件团队自研
  • Pulsar 2012年诞生于Yahoo内部

业界消息队列对比

image.png

消息队列-Kafka

使用场景

主要使用场景有:

  • 搜索服务
  • 直播服务
  • 订单服务
  • 支付服务

image.png

如何使用Kafka

  1. 创建集群
  2. 新增Topic
  3. 编写生产者逻辑
  4. 编写消费者逻辑

Kafka基本概念

Topic是逻辑队列,不同的Topic可以建立不同的Topic

Cluster:集群是分布式概念中的一组计算机。物理集群,每个集群中可以建立多个不同的Topic

Producer:生产商,负责将业务消息发送到Topic中

Consumer:消费者,负责消息Topic中的消息

ConsumerGroup:消费者组,不同组Consumer消息进度互不干涉。

Offset

消息在partition中的相对位置信息,可以理解为唯一ID,在partition中内部严格递增。

image.png

Replica

每个分片有多个Replica,Leader Replica将会从ISR中选出。

image.png

数据复制

image.png

Kafka架构

image.png

一条消息的自述

Producer---生产--->Broker---消费--->Consumer 从一条消息的视角,看看为什么Kafka能支撑这么高的吞吐量。

Producer-批量发送

批量发送可以减少IO次数,从而加强发送能力。

Producer-数据压缩

通过压缩,减少消息大小,目前支持Snappy、Gzip、LZ4、ZSTD压缩算法。

Producer-数据的存储

image.png

Broker消息文件结构

Broker磁盘结构

移动磁头找到对应磁道,磁盘转动,找到对应扇区,最后写入。寻道成本比较高,因此顺序写可以减少寻道所带来的时间成本。

image.png

Broker-顺序写

image.png

Broker-如何找到消息

Consumer 通过发送FetchRequest请求消息数据,Broker会将指定Offset处的消息,按照时间窗口和消息大小窗口发送给Consumer,寻找数据这个细节是如何做到的呢?

image.png

Broker-偏移量索引文件

目标:寻找offset=28

image.png

Broker-时间戳索引文件

二分找到小于目标时间戳最大的索引位置,在通过寻找offset的方式找到最终数据。

Broker-传统数据拷贝

image.png

Broker-零拷贝

image.png

Consumer-消息的接收端

image.png

Consumer—Low Level

通过手动进行分配,哪一个Consumer消费哪一个Partition完全由业务来决定。

image.png

Consumer-High Level

Consumer Rebalance

Producer:批量发送、数据压缩

Broker:顺序写、消息索引、零拷贝

Consumer:Rebalance

Kafka-数据复制问题

Kafka-重启操作

Kafka-替换、扩容、缩容

Kafka-负载不均衡

消息队列-BMQ

消息队列-RocketMQ