走进消息队列|青训营笔记

183 阅读2分钟

这是我参与「第三届青训营 - 后端场」笔记创作活动的的第 6 篇笔记。

一、消息队列前世今生

  • 发展历程
    • 1885: TIB
    • 1993:IBM MQ / WebSphere
    • 1997: MSMQ
    • 2001: JMS
    • 2004: AMQP/RabbitMQ
    • 2010:Kafka
    • 2011: RocketMQ
    • 2012: pulsar
  • 消息队列对比
    • Kafka: 分布式的、分区的、多副本的日志提交服务,在高吞吐场景下发挥较为出色
    • RocketMQ: 低延迟、强一致、高性能、高可靠、万亿级容量和灵活的可扩展性,在一些实时场景中运用较广
    • Pulsar: 是下一代云原生分布式消息流平台,集消息、存储、轻量化函数式计算为一体、采用存算分离的架构设计
    • BMQ: 和Pulsar架构类似,存算分离,初期定位是承接高吞吐的离线业务场景,逐步替换掉对应的Kafka集群
  • Kafka
    • 基本概念
      • Topic:逻辑队列,不同Topic可以建立不同的Topic
      • Cluster:物理集群。每个集群中可以建立多个不同的Topic
      • Producer:生产者,负责将业务消息发送到Topic中
      • Consumer:消费者,负责消费Topic中的消息
      • ConsumerGroup:消费者组,不同组 Consumer消费进度互不干涉
      • Offset:消息在 partition内的相对位置信息,可以理解为唯一ID,在 partition内部严格递增。
      • Replica: 每个分片有多个 Replica,Leader Replica将会从ISR(In-Sync Replicas)中选出。
    • 可以帮助Kafka提高吞吐或者稳定性的功能
      • Producer:批量发送、数据压缩
      • Broker:顺序写,消息索引,零拷贝
      • Consumer:Rebalance
    • 问题
      • 运维成本高
      • 对于负载不均衡的场景,解决方案复杂
      • 没有自己的缓存,完全依赖 Page Cache
      • Controller和 Coordinator和Broker在同一进程中,大量IO会造成其性能下降
  • BMQ: 兼容Kafka协议,存算分离,云原生消息队列
    • 高级特性
      • 泳道消息
        • BOE: Bytedance Offline Environment,是一套完全独立的线下机房环境
        • PPE: Product Preview Environment,即产品预览环境
      • DataBus
        • 简化消息队列客户端复杂度
        • 解耦业务与Topic
        • 缓解集群压力,提高吞吐
      • Mirror
      • Index
      • Parquet
  • RocketMQ: 感觉比Kafka多了一个tag功能
    • 高级特性
      • 事务场景
      • 延迟发送
      • 延迟消息
      • 处理失败
      • 消息重试和死信队列