问题描述
两个namenode启动时都处于standby状态,集群的namenode配置了HA
原因分析
可能原因分析
1.zookeeper异常,导致获取
2.failover controller异常。导致从备用节点切换的活动节点时失败
处理步骤
1.查看zookeeper在hdfs启动期间的日志,日志中无异常;
尝试滚动重启zookeeper,在zookeeper重启过程中会切换active节点,重启完毕之后问题依然存在;
2.查看failover controller日志
发现namenode从主节点向备节点切换时,备节点上的hdfs.keytab票据验证有问题,进一步检查备节点上的hdfs服务目录下票据,该节点上的票据失效了。
解决办法
更新failover controller上的hdfs kerberos票据,重启服务。