最近,笔者面试了个某外企SRE相关岗位(KAFKA方向),探探市场行情,整理了一些面试题,顺便使用Bing和chatGPT复盘下:
一起来看看chatGPT面试回答的如何吧!
- 分区leader及 follower 副本HW(及后续的epoch),LEO原理
- kafka为什么写数据快?大概流程是什么?
- kafka为什么读数据快?大概流程是什么?
- kafka集群常用的Grafana监控面板有哪些?
5. ISR中的Broker列表伸缩依赖的参数是replica.lag.time.max.ms
(chatGPT卡住了...)
- 分区leader选举流程是什么?
- Broker宕机后,分区leader副本,follower重分配流程是什么?
8. Broker宕机又重新加入kafka集群,分区leader副本,follower副本重分配流程是什么?
- Broker宕机又重新加入kafka集群(期间该broker停了48h,但kafka集群主题数据保留时间是24h),针对过期主题数据日志进行的操作?何时该broker正式加入ISR列表中(在该broker加入ISR列表的过程中,整个kafka集群的业务都受到了影响,如何降低该影响?
降低影响办法见:https://cwiki.apache.org/confluence/display/KAFKA/KIP-73+Replication+Quotas#KIP73ReplicationQuotas-3.CouldanISRreplicaeverbethrottled?Couldaleadereverbethrottled?)
- kafka中Controller的作用及选举方式是什么?
- kafka中Producer端默认的分区器有哪些?各自的特点是什么?
- kafka的可靠性如何保证?
- kafka的一致性如何保证?分布式系统一致性有那几种?kafka使用的那种一致性方式?(具体如何依赖isr实现)
- 常用的语义:at most once,at least once,exactly once, kafka使用了那种语义?如何使用的?
15. Broker默认配置和zk服务端的超时时间是30s(session.timeout.ms),如果broker在8s时宕机了,此时针对该broker上的分区leader,follower副本处理流程是是什么?
- 在你们项目中,kafka中使用的认证方式是什么?对kerbos了解吗?
17. min.in-sync.replication和acks=-1的关系
18. ack值是0,1,-1 对应broker端的响应关系
- kafka中replicaManager的处理流程?
- kafka集群中metadata数据是否各节点都一致?里面存了什么数据?在produce,consume过程中获取该metadata的流程是什么?
- kafka中GroupCoordinator的获取方式?常见的rebalance触发条件有哪些?rebalance流程是什么?
- ZK的leader选举流程是什么?如何标注leader是最新的?(思路:和epoch有关系)
- kafka中客户端及broker端select的使用原理?
- kafka集群中替换3个kafka节点(该集群有10个节点,主题都是3副本)的过程中,如何保证不影响业务?
(思路:使用topic-reassigned-partitions.sh先执行扩副本再执行kafka下线操作,最后执行kafka上线及缩副本操作)
-
kafka维护的最大集群规模?(kafka节点数,日数据量,节点硬件配置)
-
kafka维护遇到的问题(思路:使用火焰图排查磁盘io满导致业务读写超市,flunted,flink写读超时问题)
原文关注“云原生SRE”