安装hadoop集群问题注意安装hadoop集群问题注意，在VMware虚拟机中用CentOS7安装的，记录在安装过程中

title: 安装Hadoop集群问题注意
date: 2026-03-16
description: 记录安装Hadoop集群过程中遇到的各种问题和解决方案，包括网络配置、环境设置、集群搭建等注意事项

注意：用桥接的时候，ip地址的网段要和宿主机一样，子网掩码和网关要和宿主机一致

用NAT连接的时候，设置的静态ip可以查，如图：

屏幕截图 2026-03-26 233901.png

屏幕截图 2026-03-26 234024.png

ip地址的设置必须要在这个网段，网关设置为192.168.31.2

在配置hadoop环境文件的时候，其中在配置yarn-site.sh这个文件的时候，注意要把中文注释去掉，否则后面格式化的时候会出问题，然后导致hadoop也启动不成功
将第一个配好的虚拟机克隆，得到一个hadoop集群，再分别为其他虚拟机设置主机名，ip地址以及主机名与ip地址映射的时候，不要忘记了修改MAC地址，一旦MAC地址没有改，是无法ping通的

屏幕截图 2026-03-27 130146.png

屏幕截图 2026-03-27 130216.png

# 国家授时中心
ntpdate -u ntp.ntsc.ac.cn

屏幕截图 2026-03-27 155510.png

主节点 DataNode 缺失
- 大概率是之前多次格式化导致 clusterID 不匹配，或 DataNode 数据目录权限问题
- 也可能是主节点 slaves/workers 文件未正确配置，导致本节点未被识别为 DataNode

clusterID 不匹配

两者不一致，导致 DataNode 初始化失败并直接退出，这就是 jps 看不到 DataNode 进程的原因。

日志查看：

屏幕截图 2026-03-27 194553.png

从日志可以看到具体的clusterID不匹配错误信息。

注意将slaves文件里面的localhost去掉，不然会和hadoop1冲突
注意修改hdfs-site.sh，配置SecondaryNamenode，让其固定在 hadoop1 这台机器，50090 端口工作，不配置的话，集群找不到小助理在哪，只能瞎标一个0.0.0.0（代表所有地址）。

长期不配置的危害：

hadoop2（192.168.31.101） 的 DataNode 尝试注册时，NameNode 发现它的 storage ID 已经被 hadoop3（192.168.31.102） 使用了。

这说明两个 DataNode 节点共享了同一个存储目录或块池 ID，导致 NameNode 认为它们是同一个存储位置，拒绝新节点注册。这是因为克隆虚拟机时拷贝 DataNode 数据目录，导致 ID 重复

# 在 hadoop2 节点执行
rm -rf /home/hadoop1/hadoop/tmp/dfs/data/*

重新启动时，hadoop2 的 DataNode 会自动格式化数据目录，并生成新的、唯一的 storage ID 和 block pool ID，与 hadoop3 不冲突。

运行hadoop集群之后，输入jps之后的最终运行状态应该包含：NameNode、DataNode、SecondaryNameNode、ResourceManager、NodeManager等进程。

屏幕截图 2026-03-27 151314.png