Kafka生产调优手册如何提升吞吐量提升生产吞吐量（1）buffer.memory：发送消息的缓冲区大小，默认值是

如何提升吞吐量

（1）buffer.memory：发送消息的缓冲区大小，默认值是 32m，可以增加到 64m。

（2）batch.size：默认是 16k。如果 batch 设置太小，会导致频繁网络请求，吞吐量下降；

如果 batch 太大，会导致一条消息需要等待很久才能被发送出去，增加网络延时。

（3）linger.ms，这个值默认是 0，意思就是消息必须立即被发送。一般设置一个 5-100

毫秒。如果 linger.ms 设置的太小，会导致频繁网络请求，吞吐量下降；如果 linger.ms 太长，

会导致一条消息需要等待很久才能被发送出去，增加网络延时。

（4）compression.type：默认是 none，不压缩，但是也可以使用 lz4 压缩，效率还是不

错的，压缩之后可以减小数据量，提升吞吐量，但是会加大 producer 端的 CPU 开销。

（1）调整 fetch.max.bytes 大小，默认是 50m。

（2）调整 max.poll.records 大小，默认是 500 条。

1、acks 设置为-1 （acks=-1）

2、幂等性（enable.idempotence = true） + 事务。

1、分区副本大于等于 2 （--replication-factor 2）。

2、 ISR 里应答的最小副本数量大于等于 2 （min.insync.replicas = 2）。

事务 + 手动提交 offset （enable.auto.commit = false）。

消费者输出的目的地必须支持事务（MySQL、Kafka）。

（1）创建一个只有 1 个分区的 topic。

（2）测试这个 topic 的 producer 吞吐量和 consumer 吞吐量。

（3）假设他们的值分别是 Tp 和 Tc，单位可以是 MB/s。

（4）然后假设总的目标吞吐量是 Tt，那么分区数 = Tt / min（Tp，Tc）。

例如：producer 吞吐量 = 20m/s；consumer 吞吐量 = 50m/s，期望吞吐量 100m/s；

分区数 = 100 / 20 = 5 分区

分区数一般设置为：3-10 个

分区数不是越多越好，也不是越少越好，需要搭建完集群，进行压测，再灵活调整分区

个数。