一、🤔思考几个问题

下面这些情况应该如何处理？

解决方案： 1.解耦——将所有行为记录拉取到消息队列中，再用存储服务拉取出来进行消费；

4.日志处理

那么什么是消息队列呢？消息队列是指保存消息的一个容器，本质是个队列，需要支持高吞吐、高并发、并且高可用。

2.➡消息队列发展历程

TIB——》web Sphere——》MSMQ——》JMS——》AMQP——》Kafka——》RocketMQ——》Plisar

各个消息队列的对比：

使用场景：日志信息、Metrics数据、用户行为数据。
如何使用Kafka？创建集群——在集群中新建Topic，并设置好分区数量——编写生产者逻辑（即将写的hello world发送到Topic中）——编写消费者逻辑（即将刚刚写入的helloworld用told方法拉取出来）
下面较详细的介绍基本概念——Topic：逻辑队列； Cluster：物理集群，每个Cluster可以创建多个不同的topic； producer：生产者，负责将业务消息发送到topic中； consumer：消费者，负责消费topic中的消息； partition：topic的分区； consumergroup：消费者组，不同组consumer消费者进度互不干涉。

补充：Offset ：消息在 partition 内的相对位置信息，可以理解为唯一ID，在 partition 内部严格递增。
Replica：每个分片有多个 Replica（副本），Leader Replica 将会从ISR（In-Sync Replicas所有副本）中选出。同时，如果某个副本与leader replice的内容相差太大，该副本会被删除。

帮助Kafka提高吞吐或者稳定性的功能—— Producer：批量发送、数据压缩； Broker：顺序写（写入更快），消息索引（寻找消息的机制），零拷贝；Consumer:Rebalance

缺点：