一.Hadoop 构建基础服务环境

103 阅读2分钟

服务器环境准备

Hadoop 官方真正支持的作业平台只有Linux,本文演示如何在CentOS 7.9 上安装单机Hadoop v3.3.6(安装一个单机上运行的 Hadoop)。能顺利在 EulerOS 中安装并运行 Hadoop

安装Hadoop可以分为三种模式
1. 单机模式:Hadoop默认模式为非分布式模式(本地模式),无需其他配置即可运行非分布式Java进程,方便进行调试。Hadoop 单机模式(Standalone Mode)特点:不具备HDFS,只能测试MapReduce 程序。
2. 伪分布式模式:Hadoop 可以在单节点上以伪分布式的方式运行,Hadoop进行以分离的Java进程来运行,节点既作为NameNode 也作为DataNode。同时,读取的是HDFS中的文件。
3. 分布式模式:使用多个节点构成集群环境来运行Hadoop。

jdk安装

  1. 进入目录opt下 下载jdk文件 自己定义下载地址

    1.1打开文件

    cd /opt
    

    1.2下载jdk文件

    wget https://jinmao-jmh.oss-cn-beijing.aliyuncs.com/cui/jdk/jdk-8u331-linux-x64.tar.gz
    
  2. 解压jdk文件

   tar -zxvf jdk-8u331-linux-x64.tar.gz
  1. 配置环境变量

    3.1编辑环境变量配置

     vim /etc/profile
    

    3.2增加jdk的环境变量 如图

        JAVA_HOME=/opt/jdk1.8.0_331
        PATH=/opt/jdk1.8.0_331/bin:$PATH
        export JAVA_HOME PATH 
    

    image.png

    3.3刷新配置使环境变量生效

    source /etc/profile
    

    3.4执行验证jdk版本信息 如图证明成功

    java -version
    

    image.png

Hadoop安装

  1. 进入opt目录 下载hadoop 自己定义下载地址

    1.1打开opt目录

    cd /opt
    

    1.2下载Hadoop安装包

    wget https://jinmao-jmh.oss-cn-beijing.aliyuncs.com/cui/hadoop-3.3.6.tar.gz
    
  2. 解压缩文件

    2.1解压命令

    tar -xzf hadoop-3.3.6.tar.gz
    

    2.2创建安装目录文件

    mkdir /usr/local/haddop
    

    2.3移动解压文件到安装目录

    mv hadoop-3.3.6 /usr/local/haddop/
    
  3. 环境变量配置 注:环境变量可在 ~/.bashprofile(只对当前用户有效) 或者 /etc/profile(对所有用户有效)中配置;

    3.1 编辑环境变量配置

    vim /etc/profile
    

    3.2 增加hadoop环境变量 如图

    export HADOOP_HOME=/usr/local/hadoop/hadoop-3.3.6
    export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
    

    image.png 3.3刷新配置使环境变量生效

    source /etc/profile
    

    3.3查看命令运行地址信息 出现Hadoop信息证明成功

    echo $PATH
    

    image.png

  4. Hadoop启动配置

    4.1进入hadoop-env.sh所在目录

     cd /usr/local/haddop/hadoop-3.3.6/etc/hadoop/
    

    4.2编辑脚本增加配置 jdk环境变量

     vim hadoop-env.sh
    

    image.png

  5. Hadoop启动配置

    5.1 进入hadoop目录

     cd /usr/local/haddop/hadoop-3.3.6/
    

    5.2 执行如下命令屏幕将显示Hadoop使用文档

    bin/hadoop
    

    image.png

    5.3 查看Hadoop版本信息 能够显示版本信息证明安装成功

    bin/hadoop version
    

    image.png

  6. Hadoop测试运行示例

    6.1首先在hadoop目录下创建input目录,用来存放输入数据

    mkdir input
    

    6.2首先在hadoop目录下创建output目录,用来存放输出数据

    mkdir output
    

    6.3执行测试代码 Eg :检索input目录下有有没有正则为 dfs文件数据信息

     bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar grep input output 'dfs[a-z.]+'
    

    6.4查看输出结果

    cat output/*