kafka之reblanceConsumer消费时间过长，未及时发送心跳，导致被踢出Consumer Group而引发的

1. 概念

每次Rebalance，Consumer Group下所有成员都需要参与，而且不考虑局部性原理，之前的分配方案都不会被保留

为了解决这个问题，社区于0.11.0.0版本推出StickyAssignor，即粘性的分区分配策略

(1) 组成员数量发生变化

(2) 订阅主题数量发生变化

(1) 当Consumer Group完成Rebalance后，每个Consumer实例都会定期地向Coordinator发送心跳

(2) 如果某个Consumer实例不能及时地发送心跳

Coordinator会认为该Consumer已死，并将其从Consumer Group中移除，开启新一轮的Rebalance (3) Consumer端有一个参数session.timeout.ms，默认值为10秒
如果Coordinator在10秒内没有收到Consumer Group下某个Consumer实例的心跳，就会认为该Consumer已死 (4) Consumer端还有另一个参数heartbeat.interval.ms，默认值为3秒
设置得越小，Consumer实例发送心跳的频率就会越高，会额外消耗带宽资源，但能更快地知道是否开启Rebalance
Coordinator通过将REBALANCE_NEEDED标志封装进心跳响应中，来通知Consumer实例开启Rebalance (5)Consumer端还有另一个参数max.poll.interval.ms，默认值为5分钟
该参数用于控制Consumer实际消费能力对Rebalance的影响，限定了Consumer端两次调用poll方法的最大时间间隔
Consumer如果在5分钟内无法消费完poll方法返回的消息，就会主动发起离开组的请求，开启新一轮的Rebalance

(1)Consumer未及时发送心跳，导致被踢出Consumer Group而引发的Rebalance

生产配置：session.timeout.ms=6000 + heartbeat.interval.ms=2000
- session.timeout.ms=6000：为了让Coordinator能够更快地定位已经挂掉的Consumer
session.timeout.ms > 3 * heartbeat.interval.ms （2）Consumer消费时间过长，主动发起离开组的请求而引发的Rebalance
如果消费逻辑很重（如DB操作），可以将max.poll.interval.ms设置得大一点

(3) 关注Consumer端的GC表现，频繁的Full GC会引起非预期的Rebalance

参考文章