Hadoop集群运维管理

255 阅读2分钟

这几天因为一些小问题,又重温了一遍Hadoop分布式集群的搭建,又狠狠的锻炼了博主运维的能力。 前提:得先弄好HDFS和YARN分布式集群的搭建
废话不多说,那么下面正式开始运维吧

HDFS集群测试

  • shell命令查看NameNode状态
   bin/hdfs haadmin -getServiceState nn1
   bin/hdfs haadmin -getServiceState nn2

如果你和我一样出师不利,遇到了nn1->standby,那么请参考 (143条消息) Hadoop集群 手动主备切换 (Active - Standby)_hadoop切换主节点_温岚万叶的博客-CSDN博客)

image.png
然后变成 image.png

image.png 一主一备,一个active,一个standby。

  • Web查看NameNode状态(因为我是2.x系列版本,所以端口号是50070)
http://hadoop1:50070
http://hadoop2:50070

web UI访问:

image.png

YARN测试

  • shell命令查看RM状态
bin/yarn rmadmin -getServiceState rm1
bin/yarn rmadmin -getServiceState rm2
  • Web查看NameNode状态
http://hadoop1:8088
http://hadoop2:8088

image.png

Hadoop集群运维管理

  • NameNode守护进程管理

1.下线操作

sbin/hadoop-daemon.sh stop namenode 

2. 上线操作

sbin/hadoop-daemon.sh start namenode
  • DataNode守护进程管理
  1. 下线操作
sbin/hadoop-daemon.sh stop datanode

4. 上线操作

sbin/hadoop-daemon.sh start datanode 
  • ResourceManager守护进程管理
  1. 下线操作
sbin/yarn-daemon.sh stop resourcemanager 

2. 上线操作

sbin/yarn-daemon.sh start resourcemanager
  • NodeManager守护进程管理

1.下线操作

sbin/yarn-daemon.sh stop nodemanager

2. 上线操作

sbin/yarn-daemon.sh start nodemanager 

查看日志

查看日志
$ HADOOP_HOME/logs/hadoop-hadoop-namenode-hadoop1.log
$ HADOOP_HOME/logs/yarn-hadoop-resourcemanager-hadoop1.log
$ HADOOP_HOME/logs/hadoop-hadoop-datanode-hadoop1.log
$ HADOOP_HOME/logs/yarn-hadoop-nodemanager-hadoop1.log

清理临时文件
HDFS的临时文件路径:${hadoop.tmp.dir}/mapred/staging
本地临时文件路径:${mapred.local.dir}/mapred/local

定期执行负载均衡
脚本:sbin/start-balancer.sh -t 10%
-t:HDFS达到平衡状态的磁盘使用率偏差值。如果机器与机器之间磁盘使用率偏差小于10%,那么我们就认为HDFS集群已经达到了平衡的状态。