1.JDK配置(下载对应版本后解压,配置环境变量即可,略过)
2. 配置Hadoop
Hadoop的安装包括3中模式:
- 单机模式:只在一台机器上运行,存储采用本地文件系统,没有采用分布式文件系统HDFS
- 伪分布式模式:存储采用分布式文件系统HDFS,但是HDFS的节点和数据节点都在同一节点。
- 分布式模式:存储采用分布式文件系统HDFS,而且HDFS的节点和数据节点位于不同机器上。
Hadoop下载:mirrors.cnnic.cn/apache/hado…
这里只介绍伪分布式模式的配置方法。
2.1 伪分布式配置
-
修改hadoop-env.sh
在etc/hadoop/文件夹下,修改hadoop-env.sh如下:
我这里是已经把java jdk环境变量配置好了,也可以直接写绝对路径
-
修改配置文件:
修改hadoop下/etc/hadoop/core-site.xml 和 hdfs-site.xml文件。比如我的文件路径:
-
core-site.xml文件,添加如下配置:
其中,第一property下的value为:本机名:9000(本机名可以通过hostname查看); 第二个property下的value为:hadoop用来存放namenode相关的原数据和日志信息的文件夹路径。需要自己创建。
mdkir -p /usr/local/hadoop-2.10.0/data/tmp
-
hdfs-site.xml,添加如下配置:
-
修改slaves
将localhost改为主机名
-
-
启动hadoop
-
格式化namenode
bin/hdfs namenode -format
-
启动hadoop
sbin/hadoop-daemon.sh start namenode sbin/hadoop-daemon.sh start datanode
-
3. 配置HBase
-
修改hbase-env.sh
这里就是用自己的zookeeper,如果要做完全分布式的话,这里HBASE_MANAGES_ZK=false
-
修改hbase-site.xml
这里的改法和hadoop类似。第一个property的value还是需要自己创建,否则会使用默认的tmp文件夹。
mkdir -p /usr/local/hbase-2.2.5/data/tmp
第二个property的value为hdfs://主机名:9000/hbase
-
修改regionservers
将localhost改为主机名,主机名通过hostname获取
-
启动HBase
bin/start-hbase.sh
然后去浏览器输入:http:ip:60010进入HBase监控界面,如果出现以下界面则配置成功