服务器环境准备
Hadoop 官方真正支持的作业平台只有Linux,本文演示如何在CentOS 7.9 上安装单机Hadoop v3.3.6(安装一个单机上运行的 Hadoop)。能顺利在 EulerOS 中安装并运行 Hadoop
安装Hadoop可以分为三种模式
1. 单机模式:Hadoop默认模式为非分布式模式(本地模式),无需其他配置即可运行非分布式Java进程,方便进行调试。Hadoop 单机模式(Standalone Mode)特点:不具备HDFS,只能测试MapReduce 程序。
2. 伪分布式模式:Hadoop 可以在单节点上以伪分布式的方式运行,Hadoop进行以分离的Java进程来运行,节点既作为NameNode 也作为DataNode。同时,读取的是HDFS中的文件。
3. 分布式模式:使用多个节点构成集群环境来运行Hadoop。
jdk安装
-
进入目录opt下 下载jdk文件 自己定义下载地址
1.1打开文件
cd /opt1.2下载jdk文件
wget https://jinmao-jmh.oss-cn-beijing.aliyuncs.com/cui/jdk/jdk-8u331-linux-x64.tar.gz -
解压jdk文件
tar -zxvf jdk-8u331-linux-x64.tar.gz
-
配置环境变量
3.1编辑环境变量配置
vim /etc/profile3.2增加jdk的环境变量 如图
JAVA_HOME=/opt/jdk1.8.0_331 PATH=/opt/jdk1.8.0_331/bin:$PATH export JAVA_HOME PATH3.3刷新配置使环境变量生效
source /etc/profile3.4执行验证jdk版本信息 如图证明成功
java -version
Hadoop安装
-
进入opt目录 下载hadoop 自己定义下载地址
1.1打开opt目录
cd /opt1.2下载Hadoop安装包
wget https://jinmao-jmh.oss-cn-beijing.aliyuncs.com/cui/hadoop-3.3.6.tar.gz -
解压缩文件
2.1解压命令
tar -xzf hadoop-3.3.6.tar.gz2.2创建安装目录文件
mkdir /usr/local/haddop2.3移动解压文件到安装目录
mv hadoop-3.3.6 /usr/local/haddop/ -
环境变量配置 注:环境变量可在 ~/.bashprofile(只对当前用户有效) 或者 /etc/profile(对所有用户有效)中配置;
3.1 编辑环境变量配置
vim /etc/profile3.2 增加hadoop环境变量 如图
export HADOOP_HOME=/usr/local/hadoop/hadoop-3.3.6 export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH3.3刷新配置使环境变量生效
source /etc/profile3.3查看命令运行地址信息 出现Hadoop信息证明成功
echo $PATH -
Hadoop启动配置
4.1进入hadoop-env.sh所在目录
cd /usr/local/haddop/hadoop-3.3.6/etc/hadoop/4.2编辑脚本增加配置 jdk环境变量
vim hadoop-env.sh -
Hadoop启动配置
5.1 进入hadoop目录
cd /usr/local/haddop/hadoop-3.3.6/5.2 执行如下命令屏幕将显示Hadoop使用文档
bin/hadoop5.3 查看Hadoop版本信息 能够显示版本信息证明安装成功
bin/hadoop version -
Hadoop测试运行示例
6.1首先在hadoop目录下创建input目录,用来存放输入数据
mkdir input6.2首先在hadoop目录下创建output目录,用来存放输出数据
mkdir output6.3执行测试代码 Eg :检索input目录下有有没有正则为 dfs文件数据信息
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar grep input output 'dfs[a-z.]+'6.4查看输出结果
cat output/*