hadoop伪分布式下无法启动datanode的原因及解决办法1. 环境描述：虚拟机12.0，Ubuntu 14.0

「这是我参与11月更文挑战的第23天，活动详情查看：2021最后一次更文挑战」。

1. 环境描述：

虚拟机12.0，Ubuntu 14.04，伪分布式安装Hadoop2.6。

2. 问题描述：

多次格式化文件系统时，会出现datanode无法启动。如下图：

3. 问题产生原因：

执行文件系统格式化时（即执行命令$ bin/hadoop namenode -format 后），会在namenode数据文件夹（即配置文件中dfs.name.dir在本地系统的路径）中保存一个current/VERSION（我的路径为 usr/local/hadoop/tmp/dfs/name/current/VERSION，其中hadoop为建立虚拟机时为虚拟机系统所取的用户名）文件，记录namespaceID，标识了所格式化的namenode的版本。如果我们频繁的格式化namenode，那么datanode中保存（即配置文件中dfs.data.dir在本地系统的路径）的current/VERSION文件（路径为usr/local/hadoop/tmp/dfs/data/current/VERSION）只是你第一次格式化时保存的namenode的ID，因此就会造成namdenode 的 namespaceID 与 datanode的namespaceID 不一致，从而导致namenode和 datanode的断连。

4. datanode启动日志：

查看日志(在/usr/local/hadoop/logs/hadoop-hadoop-datanode-hadoop-virtual-machine.log下)发现：

************************************************************/

2017-07-3 17:40:59,973 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: java.io.IOException: Incompatible namespaceIDs in /home/xsj/hadoop/hadoop-0.20.2/hdfs/data: namenode namespaceID = 1825353369; datanode namespaceID = 1986950792

5. 解决方案：

把/tmp下的Hadoop开关的临时文件删除
把/hadoop.tmp.dir目录清空
注：在每次执行hadoop namenode -format时，都会为NameNode生成namespaceID,，但是在hadoop.tmp.dir目录下的DataNode还是保留上次的namespaceID，因为namespaceID的不一致，而导致DataNode无法启动，所以只要在每次执行hadoop namenode -format之前，先删除hadoop.tmp.dir（路径为 /usr/local/hadoop/tmp）目录就可以启动成功。请注意是删除hadoop.tmp.dir对应的本地目录，即/usr/local/hadoop/下的tmp文件夹，而不是HDFS目录。

6. 重启后执行jps命令：

7. 总结：

以后在hadoop format过程中要注意不要频繁地reformat namnode（格式化命令为 ./bin/hadoop namenode -format）的ID信息。format过程中选择N（否）就是了。

[1] Hadoop中datanode无法启动 - wly603 - 博客园

[2] 如流，新一代智能工作平台

hadoop伪分布式下 无法启动datanode的原因及解决办法

hadoop伪分布式下无法启动datanode的原因及解决办法