和chatGPT聊了聊Kafka相关的面试题

2023-03-28 130 阅读3分钟

最近，笔者面试了个某外企SRE相关岗位（KAFKA方向），探探市场行情，整理了一些面试题，顺便使用Bing和chatGPT复盘下：

一起来看看chatGPT面试回答的如何吧！

分区leader及 follower 副本HW（及后续的epoch），LEO原理

kafka为什么写数据快？大概流程是什么？

kafka为什么读数据快？大概流程是什么？

kafka集群常用的Grafana监控面板有哪些？

5. ISR中的Broker列表伸缩依赖的参数是replica.lag.time.max.ms

（chatGPT卡住了...）

分区leader选举流程是什么？

Broker宕机后，分区leader副本，follower重分配流程是什么？

8. Broker宕机又重新加入kafka集群，分区leader副本，follower副本重分配流程是什么？

Broker宕机又重新加入kafka集群（期间该broker停了48h，但kafka集群主题数据保留时间是24h），针对过期主题数据日志进行的操作？何时该broker正式加入ISR列表中（在该broker加入ISR列表的过程中，整个kafka集群的业务都受到了影响，如何降低该影响？

降低影响办法见：https://cwiki.apache.org/confluence/display/KAFKA/KIP-73+Replication+Quotas#KIP73ReplicationQuotas-3.CouldanISRreplicaeverbethrottled?Couldaleadereverbethrottled?）

kafka中Controller的作用及选举方式是什么？

kafka中Producer端默认的分区器有哪些？各自的特点是什么？

kafka的可靠性如何保证？

kafka的一致性如何保证？分布式系统一致性有那几种？kafka使用的那种一致性方式？（具体如何依赖isr实现）

常用的语义：at most once，at least once，exactly once, kafka使用了那种语义？如何使用的？

15. Broker默认配置和zk服务端的超时时间是30s（session.timeout.ms）,如果broker在8s时宕机了，此时针对该broker上的分区leader，follower副本处理流程是是什么？

在你们项目中，kafka中使用的认证方式是什么？对kerbos了解吗？

17. min.in-sync.replication和acks=-1的关系

18. ack值是0，1，-1 对应broker端的响应关系

kafka中replicaManager的处理流程？

kafka集群中metadata数据是否各节点都一致？里面存了什么数据？在produce,consume过程中获取该metadata的流程是什么？

kafka中GroupCoordinator的获取方式？常见的rebalance触发条件有哪些？rebalance流程是什么？

ZK的leader选举流程是什么？如何标注leader是最新的？（思路：和epoch有关系）

kafka中客户端及broker端select的使用原理？

kafka集群中替换3个kafka节点（该集群有10个节点，主题都是3副本）的过程中，如何保证不影响业务？

（思路：使用topic-reassigned-partitions.sh先执行扩副本再执行kafka下线操作，最后执行kafka上线及缩副本操作）

kafka维护的最大集群规模？（kafka节点数，日数据量，节点硬件配置）
kafka维护遇到的问题（思路：使用火焰图排查磁盘io满导致业务读写超市，flunted,flink写读超时问题）

原文关注“云原生SRE”