linux软件的安装与使用SVN git 服务器版 lrzsz(直接拖拽文件到服务器) nginx 配置说明 nginx

SVN

#svn的启动命令
$ /usr/bin/svnserve -d -r /home/aly/svn --listen-port 8080
$ svnserve -d -r /home/svndata/ --listen-port 8080

git

服务器版

//安装依赖
yum -y install curl-devel expat-devel gettext-devel openssl-devel zlib-devel gcc perl-ExtUtils-MakeMaker

//解压到/usr/local/
tar -zxvf git-2.9.3.tar.gz

//进入到cd /usr/local/git-2.9.3
cd /usr/local/git-2.9.3
    
//编译 /usr/local/git-2.9.3
make prefix=/usr/local all

//安装
make prefix=/usr/local install



    
 //=======创建仓库======   
    
    
//添加用户名(git)--添加用户就相当于在/home/下创建了一个git文件夹
useradd 用户名  
//设置密码(git)
passwd 密码  

//创建仓库目录(如果有这个目录则不创建)
mkdir  /home/git


//切换到git账号
su git

//创建git仓库
git init --bare 项目名称.git 


//git bash 执行命令,生成公钥和私钥,本地电脑执行
ssh-keygen -t rsa

//切换到root用户在/home/git创建.ssh目录
mkdir .ssh

//上传在本地电脑上生成的id_rsa.pub公钥到.ssh目录，让后修改名称
mv id_rsa.pub authorized_keys

//设置权限，此步骤不能省略，而且权限值也不要改，不然会报错。
chmod 700 /home/git/.ssh/
chmod 600 /home/git/.ssh/authorized_keys

lrzsz(直接拖拽文件到服务器)

$ yum -y install lrzsz
#小的文件可以这样使用

nginx

//nginx安装依赖命令
yum -y install gcc zlib zlib-devel pcre-devel openssl openssl-devel

//上传nginx安装包并解压
tar -zxvf nginx-1.8.0.tar.gz

//进入解压文件夹
cd nginx-1.8.0
    
//初始化
./configure \
--prefix=/usr/local/nginx \
--pid-path=/var/run/nginx/nginx.pid \
--lock-path=/var/lock/nginx.lock \
--error-log-path=/var/log/nginx/error.log \
--http-log-path=/var/log/nginx/access.log \
--with-http_gzip_static_module \
--http-client-body-temp-path=/var/temp/nginx/client \
--http-proxy-temp-path=/var/temp/nginx/proxy \
--http-fastcgi-temp-path=/var/temp/nginx/fastcgi \
--http-uwsgi-temp-path=/var/temp/nginx/uwsgi \
--http-scgi-temp-path=/var/temp/nginx/scgi

//创建没有的目录
mkdir -p /var/temp/nginx/
    
//进入到解压目录/root/nginx-1.8.0，执行make编译
make
//在安装
make install

//启动nginx
/usr/local/nginx/sbin/nginx

//停止nginx第一种方式，此方式相当于先查出nginx进程id再使用kill命令强制杀掉进程。
/usr/local/nginx/sbin/nginx -s stop

//停止nginx第二种方式，此方式停止步骤是待nginx进程处理任务完毕进行停止。
/usr/local/nginx/sbin/nginx -s quit

//不重启，让配置文件生效
/usr/local/nginx/sbin/nginx -s reload


//配置nginx.conf
http{
	upstream tomcat_server{
        server 192.168.200.132:8080;
        server 192.168.200.131:8080;
	}
    server{
    	listen      80;
    	server_name localhost;
        location / {
        	proxy_pass http://tomcat_server;
        	root html;
        	index index.html index.htm;
        }
    }
}

//配置权重
upstream tomcat_server{
   server 192.168.200.132:8080 weight=20;
   server 192.168.200.131:8080 weight=10;
}




./configure --prefix=/usr/local/nginx/ --with-pcre=/usr/local/pcre-8.40 --with-openssl=/usr/local/openssl-1.0.2s --with-http_ssl_module --with-http_v2_module

配置说明



#方式一

listen       80;
server_name  172.21.51.71;
root  html/VAP;
index  index.html index.htm;

charset utf-8;

location / {
		proxy_pass   http://172.21.51.75:8099;    #在这里设置一个代理，和upstream的名字一样
}
  
location ~ .*\.(gif|jpg|jpeg|png|bmp|swf|js|css)$ {
		expires      30d;
		access_log /dev/null;
}




#方式二

server{
    listen        80; #对外端口
    server_name   localhost; #对外ip或者域名
    
    location / {
        root   html/dist; #静态资源容器
        index  index.html index.htm;
        try_files $uri $uri/ @router;
    }
    
    location ^~ /api/ {
        proxy_pass  http://ip:port; # 后端代理ip:port,注意路径后边不要加 /
        #add_header 'Access-Control-Allow-Origin' 'http://*.*.*.*:8085'; #设置跨域
        #add_header 'Access-Control-Allow-Credentials' 'true';
    }
    
    location @router {
        rewrite ^.*$ /index.html last;
    }
    
}



#方式三

listen       80;
	server_name  localhost;

	
	#charset utf-8;

	location / {
		root  html/VAP;
		#index  index.html index.htm;
		try_files $uri $uri/ /index.html;
		

	}

	location /api/ {
		#rewrite ^/api/(.*)$ /$1 break; 
		proxy_pass   http://172.21.51.75:8099/;
        }

nginx的反向代理配置

#1.入口服务器
server {
        listen       8181;
        server_name  localhost;

        proxy_set_header X-Forwarded-Host $host;
        proxy_set_header X-Forwarded-Server $host;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

        location / {
                        proxy_pass http://172.21.51.79:8080;
                        proxy_connect_timeout 600;
                        proxy_read_timeout 600;
        }
}



#2.静态服务器
http {
    upstream backend {
           server 172.21.51.75:8081;
           server 172.21.51.74:8081;
    }
    server {
        listen       8080;
        server_name  localhost;
 
        location / {
                root  html/dist;
                #index  index.html index.htm;
                try_files $uri $uri/ /index.html;
        }

        location /callOpen {
            proxy_pass   http://backend;
        }
        
        error_page   500 502 503 504  /50x.html;
        location = /50x.html {
            root   html;
        }
    }
}



#3.服务端服务器

tomcat

配置tomcat开机启动

#在bin目录新建一个auto-startup.sh文件

export JAVA_HOME=/usr/java/jdk1.8.0_201
export PATH=$JAVA_HOME/bin/:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$CLASSPATH
export CATALINA_HOME=/home/snail/apache-tomcat-8.5.39
/home/snail/apache-tomcat-8.5.39/bin/catalina.sh start



#修改乱码
URIEncoding="UTF-8"

mysql

//安装
sudo yum -y install mysql-server

//编辑配置文件
sudo vim /etc/my.cnf
//修改my.cnf里的字符集
character-set-server=utf8
default-character-set=utf8

//自启动
sudo chkconfig mysqld on

//查看自启动
sudo chkconfig --list mysqld

//启动mysql
sudo service mysqld restart

//初始登录
mysql -u root

//查看用户
select user,host,password from mysql.user;

//修改密码
set password for root@localhost = password('newpassword');

//删除匿名用户
delete from mysql.user where user='';

//创建用户
insert into mysql.user(host,user,password) values("localhost","newUser",password("password"));

//赋予自定义用户权限，允许远程访问
grant all privileges on newUser.* to newUser@localhost identified by 'password';

//刷新
flush privileges;

zookeeper安装

单机安装步骤

//在/usr/locat/下创建zookeeper目录
$ mkdir zookeeper
//进入目录，复制源码到当前目录
$ cp /root/zookeeper-3.4.6.tar.gz ./
//解压-C强制解压
$ tar -zxvf zookeeper-3.4.6.tar.gz -C
//解压后进到conf文件夹，把zoo_sample.cfg复制修改为zoo.cfg
$ cp zoo_sample.cfg zoo.cfg
//进到bin目录进行zookeeper的启动停止操作

//启动
$ ./zkServer.sh start
//查看状态是否启动成功,standalone 孤独的启动着
$ ./zkServer.sh status

//停止
$ ./zkServer.sh stop

集群安装步骤

一、解压文件到指定目录

$ tar -zxvf zookeeper-3.4.9.tar.gz -C ../servers/

二、修改配置文件

#进入到zookeeper解压目录
#在进入到conf文件,复制并改名为zoo.cfg
$ cp zoo_sample.cfg zoo.cfg

#创建个数据文件夹 /export/servers/zookeeper-3.4.9/zkdatas
$ mkdir zkdatas

$ vim zoo.cfg

#修改dataDir路径
dataDir=/export/servers/zookeeper-3.4.9/zkdatas

#打开这两个的注释，3是指保存3个快照
autopurge.snapRetainCount=3
#0是不合并，1是合并
autopurge.purgeInterval=1

#添加
server.1=node01.hadoop.com:2888:3888
server.2=node02.hadoop.com:2888:3888
server.3=node03.hadoop.com:2888:3888

#保存退出

三、在创建myid文件

#在这个/export/servers/zookeeper-3.4.9/zkdatas路径下创建一个myid
$ vim myid
#添加数字1，保存退出

四、把zookeeper发送到另外的服务器

#回退到/export/servers目录，就是安装zk的目录
$ scp -r zookeeper-3.4.9/ node02:$PWD
$ scp -r zookeeper-3.4.9/ node03:$PWD
或者
$ scp -r zookeeper-3.4.9/ node02:/export/servers/
$ scp -r zookeeper-3.4.9/ node03:/export/servers/

五、修改其他服务器上的myid的值

#修改对应服务器上的myid的值

六、启动

./bin/zkServer.sh start #启动
./bin/zkServer.sh stop #停止
./bin/zkServer.sh status #查看状态

redis

redis中文官网 www.redis.net.cn

单机安装

ps -aux | grep redis //查看pid进程
  
./redis-server --port 6003 &  //设置端口6003，“&”表示在后台运行
./redis-cli -p 6003 //指定端口启动cli客户端工具


$ make //是编译
$ make install PREFIX='/usr/local/redis/6379'  //安装并指定安装路径


//配置文件路径  /usr/local/redis/redis-3.0.0/redis.conf
//拷贝到指定的安装目录bin下
$ cp redis.conf /usr/local/redis/6379/bin/
    
    
//修改拷贝过来的配置文件
$ vim redis.conf
//把 daemonize no  修改为 daemonize yes   后台启动运行

//带配置文件启动
$ ./redis-server redis.conf

//管道查看
ps -ef | grep redis

//启动redis
/home/snail/redis-2.8.17/src/redis-server redis.conf

redis集群搭建

//至少6台

//拷贝一份
$ cp -r 6379 7001
    
//停用状态下删除/usr/local/redis/7001/bin/dump.rdb垃圾数据
$ rm -rf dump.rdb

//修改配置文件
$ vim /usr/local/redis/7001/bin/redis.conf
//修改端口
# prot 7001
//修改集群权限
# cluster-enabled yes

//创建启动脚本文件
$ touch /usr/local/redis/start-redis.sh

//修改文件权限
$ chmod 777 /usr/local/redis/start-redis.sh

//编辑start-redis.sh脚本
cd /usr/local/redis/7001/bin/
./redis-server redis.conf
cd /usr/local/redis/7002/bin/
./redis-server redis.conf
cd /usr/local/redis/7003/bin/
./redis-server redis.conf
cd /usr/local/redis/7004/bin/
./redis-server redis.conf
cd /usr/local/redis/7005/bin/
./redis-server redis.conf
cd /usr/local/redis/7006/bin/
./redis-server redis.conf

//启动集群
./start-redis.sh


//拷贝redis-trib.rb到
$ cp /usr/local/redis/redis-3.0.0/src/redis-trib.rb /usr/local/redis/
    
//需要安装ruby，自行百度
    
//安装redis和ruby的整合包,/root/redis/redis-3.0.0.gem
$ gem install redis-3.0.0.gem

//cd 到/usr/local/redis/
$ cd /usr/local/redis/
    
//运行redis-trib.rb脚本创建集群
./redis-trib.rb create --replicas 1 192.168.200.128:7001 192.168.200.128:7002 192.168.200.128:7003 192.168.200.128:7004 192.168.200.128:7005 192.168.200.128:7006
    
    
//连接集群
$ ./redis-cli -p 7001 -c  //-p是指端口，-c是指集群
$ /usr/local/redis/7001/bin/redis-cli -p 7001 -c

redis.conf

# Redis默认不是以守护进程的方式运行，可以通过该配置项修改，使用yes启用守护进程
# 启用守护进程后，Redis会把pid写到一个pidfile中，在/var/run/redis.pid
daemonize no

# 当Redis以守护进程方式运行时，Redis默认会把pid写入/var/run/redis.pid文件，可以通过pidfile指定
pidfile /var/run/redis.pid

# 指定Redis监听端口，默认端口为6379
# 如果指定0端口，表示Redis不监听TCP连接
port 6379

# 绑定的主机地址
# 你可以绑定单一接口，如果没有绑定，所有接口都会监听到来的连接
bind 127.0.0.1
# 也就是本机

# 当客户端闲置多长时间后关闭连接，如果指定为0，表示关闭该功能
timeout 0

# 指定日志记录级别，Redis总共支持四个级别：debug、verbose、notice、warning，默认为verbose
# debug (很多信息, 对开发／测试比较有用)
# verbose (many rarely useful info, but not a mess like the debug level)
# notice (moderately verbose, what you want in production probably)
# warning (only very important / critical messages are logged)
loglevel verbose

# 日志记录方式，默认为标准输出，如果配置为redis为守护进程方式运行，而这里又配置为标准输出，则日志将会发送给/dev/null
logfile stdout

# 设置数据库的数量，默认数据库为0，可以使用select <dbid>命令在连接上指定数据库id
# dbid是从0到‘databases’-1的数目
databases 16

################################ SNAPSHOTTING  #################################
# 指定在多长时间内，有多少次更新操作，就将数据同步到数据文件，可以多个条件配合
# Save the DB on disk:
#
#   save <seconds> <changes>
#
#   Will save the DB if both the given number of seconds and the given
#   number of write operations against the DB occurred.
#
#   满足以下条件将会同步数据:
#   900秒（15分钟）内有1个更改
#   300秒（5分钟）内有10个更改
#   60秒内有10000个更改
#   Note: 可以把所有“save”行注释掉，这样就取消同步操作了

save 900 1
save 300 10
save 60 10000

# 指定存储至本地数据库时是否压缩数据，默认为yes，Redis采用LZF压缩，如果为了节省CPU时间，可以关闭该选项，但会导致数据库文件变的巨大
rdbcompression yes

# 指定本地数据库文件名，默认值为dump.rdb
dbfilename dump.rdb

# 工作目录.
# 指定本地数据库存放目录，文件名由上一个dbfilename配置项指定
# 
# Also the Append Only File will be created inside this directory.
# 
# 注意，这里只能指定一个目录，不能指定文件名
dir ./

solr

单机安装

//在 /usr/local/ 下创建一个文件夹solr
$ mkdir solr

//进入到solr目录
$ cd solr

//拷贝安装包到此目录
$ cp /root/solr/solr-4.10.3.tar ./
$ cp /root/solr/IKAnalyzer2012FF_hf1.zip ./
$ cp /root/tomcat/apache-tomcat-7.0.47.tar.gz ./
    
//解压三个文件到当前目录
$ tar -zxvf apache-tomcat-7.0.47.tar.gz
$ tar -zxvf solr-4.10.3.tar

//创建ik目录把IKAnalyzer2012FF_hf1.zip移动到此目录
$ mv IKAnalyzer2012FF_hf1.zip ik/
    
//进入ik目录,解压
$ unzip IKAnalyzer2012FF_hf1.zip

//把war包放到tomcat中
$ cp solr-4.10.3/example/webapps/solr.war tomcat7/webapps/

//启动tomcat解压war，让后停掉tomcat
$ sh tomcat7/bin/startup.sh 
$ sh tomcat7/bin/shutdown.sh

//让后删除solr.war包
$ rm -rf solr.war

//拷贝log4j的jar包到tomcat中
$ cp solr-4.10.3/example/lib/ext/* tomcat7/webapps/solr/WEB-INF/lib/

*/

//拷贝这个solr到当前目录
$ cp -r solr-4.10.3/example/solr ./
    
//修改名字为,/usr/local/solr/solrhome
$ mv solr solrhome


//修改web.xml文件
$ vim tomcat7/webapps/solr/WEB-INF/web.xml

<env-entry>
     <env-entry-name>solr/home</env-entry-name>
     <env-entry-value>/usr/local/solr/solrhome</env-entry-value>
     <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

//让后启动tomcat

//复制实例,cd solrhome
$ cp -r collection1 collection2

//cd collection2中 编辑core.properties，修改name=collection1为name=collection2
$ cd collection2
$ vim core.properties

//重启tomcat

//

solr集群搭建

//至少4台

//复制solrhome和tomcat为solrhome8081，tomcat8081
$ cp -r solrhome solrhome8081
$ cp -r tomcat tomcat8081
//进到collection1里面删除data文件夹
$ rm -rf data/
    
//修改tomcat的端口，打开server.xml
$ vim /usr/local/solr/tomcat8081/conf/server.xml

//修改web.xml中的solrhome路径
$ vim /usr/local/solr/tomcat8081/webapps/solr/WEB-INF/web.xml

//传配置文件到zk中
sh /usr/local/solr/solr-4.10.3/example/scripts/cloud-scripts/zkcli.sh -zkhost 192.168.200.128:2181,192.168.200.128:2182,192.168.200.128:2183 -cmd upconfig -confdir /usr/local/solr/solr-4.10.3/example/solr/collection1/conf/ -confname myconf -solrhome /usr/local/solr/solr-4.10.3/example/solr

//修改tomcat/bin中的catalina.sh文件，添加zk的地址可端口
vim /usr/local/solr/tomcat8081/bin/catalina.sh
//添加如下内容
JAVA_OPTS="-DzkHost=192.168.200.128:2181,192.168.200.128:2182,192.168.200.128:2183"
    
//修改solr的solr.xml文件里jetty的端口为8081
$ vim /usr/local/solr/solrhome8081/solr.xml





//分片配置

//打开core.properties文件
$ vim /usr/local/solr/solrhome8081/collection1/core.properties
//添加下面内容
numShards=2 //分片数量
name=collection1 //core名称
shard=shard1 //所属分片
coreNodeName=core_node1 //结点名称

cas

//在 /usr/local/ 下创建一个文件夹cas
$ mkdir cas

//进入到cas目录
$ cd cas

//拷贝安装包到此目录
$ cp /root/cas/cas.war ./
$ cp /root/cas/apache-tomcat-7.0.47.tar.gz ./
    
//解压tomcat到当前目录
$ tar -zxvf apache-tomcat-7.0.47.tar.gz

//修改tomcat的目录名称
$ mv apache-tomcat-7.0.47 tomcat

//把war包放到tomcat中
$ cp cas.war tomcat/webapps/
    
//启动tomcat解压war，让后停掉tomcat
$ sh tomcat/bin/startup.sh 
$ sh tomcat/bin/shutdown.sh

//让后删除solr.war包
$ rm -rf cas.war

//可以修改tomcat的端口
$ vim /usr/local/cas/tomcat/conf/server.xml

//修改CAS配置文件
$ vim /usr/local/cas/tomcat/webapps/cas/WEB-INF/cas.properties

//修改为服务器的ip和端口
server.name=http://192.168.200.128:9100

/*去除https认证*/

//1.修改WEB-INF/deployerConfigContext.xml文件中
<bean class="org.jasig.cas.authentication.handler.support.HttpBasedServiceCredentialsAuthenticationHandler"
p:httpClient-ref="httpClient" p:requireSecure="false"/>

//2.修改cas的/WEB-INF/spring-configuration/ticketGrantingTicketCookieGenerator.xml

<bean id="ticketGrantingTicketCookieGenerator" class="org.jasig.cas.web.support.CookieRetrievingCookieGenerator" p:cookieSecure="false"  p:cookieMaxAge="3600" p:cookieName="CASTGC"  p:cookiePath="/cas" />
    
//3.修改cas的WEB-INF/spring-configuration/warnCookieGenerator.xml
<bean id="warnCookieGenerator" class="org.jasig.cas.web.support.CookieRetrievingCookieGenerator"
p:cookieSecure="false"
p:cookieMaxAge="3600"
p:cookieName="CASPRIVACY"
p:cookiePath="/cas" />



//启动tomcat
$ sh startup.sh


//修改配置文件支持退出登录，修改cas系统的配置文件WEB-INF目录下的cas-servlet.xml
<bean id="logoutAction" class="org.jasig.cas.web.flow.LogoutAction"
        p:servicesManager-ref="servicesManager"
        p:followServiceRedirects="${cas.logout.followServiceRedirects:true}"/>

配置数据源

<!--需要的jar包-->
c3p0-0.9.1.2.jar 
cas-server-support-jdbc-4.0.0.jar
mysql-connector-java-5.1.32.jar

<!--把三个jar包复制到此路径/usr/local/cas/tomcat/webapps/cas/WEB-INF/lib-->


<!--修改cas服务端中WEB-INF下deployerConfigContext.xml ，添加如下配置-->
<bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource"  
			  p:driverClass="com.mysql.jdbc.Driver"  
			  p:jdbcUrl="jdbc:mysql://192.168.200.128:3306/pinyougoudb?characterEncoding=utf8"  
			  p:user="root"  
			  p:password="admin" />

	<bean id="passwordEncoder" class="org.jasig.cas.authentication.handler.DefaultPasswordEncoder"  
		c:encodingAlgorithm="MD5"  
		p:characterEncoding="UTF-8" />

	<bean id="dbAuthHandler"  class="org.jasig.cas.adaptors.jdbc.QueryDatabaseAuthenticationHandler"  
		  p:dataSource-ref="dataSource"  
		  p:sql="select password from tb_user where username = ?"  
		  p:passwordEncoder-ref="passwordEncoder"/>


<!--此内容-->
<entry key-ref="primaryAuthenticationHandler" value-ref="primaryPrincipalResolver" />
<!--改为-->
<entry key-ref="dbAuthHandler" value-ref="primaryPrincipalResolver"/>

keepalived

安装

//安装
rpm -ivh keepalived-1.2.13-5.el6_6.i686.rpm

//查看安装路径
rpm -ql keepalived

//清空 /etc/keepalived/keepalived.conf 配置文件
echo  > keepalived.conf

//把下面内容复制到 keepalived.conf 配置文件里

! Configuration File for keepalived
#全局配置
global_defs {
   notification_email {  #指定keepalived在发生切换时需要发送email到的对象，一行一个
     XXX@XXX.com
   }
   notification_email_from XXX@XXX.com  #指定发件人
   #smtp_server XXX.smtp.com            #指定smtp服务器地址
   #smtp_connect_timeout 30             #指定smtp连接超时时间
   router_id LVS_DEVEL                  #运行keepalived机器的一个标识
}

vrrp_instance VI_1 { 
    state MASTER           #标示状态为MASTER 备份机为BACKUP
    interface eth0         #设置实例绑定的网卡
    virtual_router_id 51   #同一实例下virtual_router_id必须相同
    priority 100           #MASTER权重要高于BACKUP 比如BACKUP为99  
    advert_int 1           #MASTER与BACKUP负载均衡器之间同步检查的时间间隔，单位是秒
    authentication {       #设置认证
        auth_type PASS     #主从服务器验证方式
        auth_pass 8888
    }
    virtual_ipaddress {    #设置vip
        192.168.200.100    #可以多个虚拟IP，换行即可
		192.168.200.101
    }
}



//启动
service keepalived start

//停止
service keepalived stop

//创建一个check_nginx.sh 作用：检测nginx，如果nginx崩了，那么keepalived自杀进程
touch /etc/keepalived/check_nginx.sh
//赋予最高权限
chmod 777 check_nginx.sh

//复制下面对容到check_nginx.sh中
#!/bin/bash
# 如果进程中没有nginx则将keepalived进程kill掉
A=`ps -C nginx --no-header |wc -l`      ## 查看是否有 nginx进程 把值赋给变量A 
if [ $A -eq 0 ];then                    ## 如果没有进程值得为 零
       service keepalived stop          ## 则结束 keepalived 进程
fi

//打开配置文件
vim /etc/keepalived/keepalived.conf

//在配置文件中添加脚本监控
vrrp_script check_nginx {
    script "/etc/keepalived/check_nginx.sh"         ##监控脚本
    interval 2                                      ##时间间隔，2秒
    weight 2                                        ##权重
}

track_script {
    check_nginx        #监控脚本
}

docker

安装(centos)

#第一步 安装依赖
sudo yum install -y yum-utils device-mapper-persistent-data lvm2

#第二步 添加stable的Docker-ce的源
sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo

#第三步 安装docker-ce
sudo yum install docker-ce docker-ce-cli containerd.io

启动

#启动docker进程
systemctl start docker

#查看进程状态
systemctl status docker

docker镜像加速

vim /etc/docker/daemon.json

#编辑daemon.json
{"registry-mirrors":["https://registry.docker-cn.com"]}

#重启服务
sudo systemctl daemon-reload
sudo systemctl restart docker

移除

#删除久的版本
sudo yum remove docker docker-client docker-client-latest docker-common docker-latest docker-latest-logrotate docker-logrotate docker-engine

docker-compose

安装

#在线安装
sudo curl -L "https://github.com/docker/compose/releases/download/1.23.2/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose

#赋执行权限
chmod +x /usr/local/bin/docker-compose

#查看版本
docker-compose --version

使用

#创建个docker-compose.yml配置文件
vim ~/docker-compose.yml

version: '3'
services:
  mysql1:
    image: mysql
    environment:
    - MYSQL_ROOT_PASSWORD=123456
    ports: 
    - 28002:3306
  mysql2:
    image: mysql
    environment:
    - MYSQL_ROOT_PASSWORD=123456
    ports: 
    - 28003:3306
    
    
    
    
#执行命令
docker-compose up -d

#停止
docker-compose stop

docker命令使用

#查看所有容器
docker ps –a

#查看日志
docker logs -f name

部署linux服务器集群

一、关闭防火墙

#1.关闭防火墙
$ service iptables stop

#2.设置开机不启动
$ chkconfig iptables off

#3.关闭selinux
$ vim /etc/selinux/config 
#注释掉 SELINUX=enforcing,添加
SELINUX=disabled

二、更改主机名

$ vim /etc/sysconfig/network

HOSTNAME=node01.hadoop.com
HOSTNAME=node02.hadoop.com
HOSTNAME=node03.hadoop.com

三、主机名与IP地址的映射

$ vim /etc/hosts

192.168.52.100 node01.hadoop.com node01
192.168.52.110 node02.hadoop.com node02
192.168.52.120 node03.hadoop.com node03

四、免密码登录

#1.每台机器生成公钥私钥
#生成的公钥私钥在/root/.ssh/下面，私钥：id_rsa 公钥：id_rsa.pub
$ ssh-keygen -t rsa


#2.将每台机器的公钥拷贝到同一台机器上面去
$ ssh-copy-id node01

#3.将拷贝后的公钥发给所有其他的机器(在node01上操作)
#$PWD是把当前目录的authorized_keys拷贝到目标服务器的当前目录
scp authorized_keys node02:/root/.ssh
scp authorized_keys node03:$PWD

五、时钟同步

第一种方式：通过网络进行时钟同步，通过网络连接外网进行时钟同步,必须保证虚拟机连上外网

#定时同步时钟
$ crontab  -e

#每分钟同步
*/1 * * * * /usr/sbin/ntpdate ntp4.aliyun.com

第二种时钟同步方式：通过某一台机器进行同步

#以192.168.52.100这台服务器的时间为准进行时钟同步

#一、确定是否安装了ntpd的服务
$ rpm -qa  | grep  ntpd

#如果没有安装，就安装
$ yum -y install ntpd
#启动ntpd的服务
$ service  ntpd  start
#设置ntpd的服务开机启动
$ chkconfig ntpd on

#二、编辑/etc/ntp.conf，编辑第一台机器的/etc/ntp.conf

$ vim /etc/ntp.conf
#在文件中添加如下内容
restrict 192.168.52.0 mask 255.255.255.0 nomodify notrap

#注释一下四行内容
#server  0.centos.pool.ntp.org
#server  1.centos.pool.ntp.org
#server  2.centos.pool.ntp.org
#server  3.centos.pool.ntp.org

#去掉以下内容的注释，如果没有这两行注释，那就自己添加上
server   127.127.1.0  #  local  clock
fudge    127.127.1.0  stratum  10

#配置以下内容，保证BIOS与系统时间同步
$ vim  /etc/sysconfig/ntpd

#添加一行内容  
SYNC_HWLOCK=yes                                 

#三、另外两台机器与192.168.52.100进行时钟同步
$ crontab -e
*/1 * * * * /usr/sbin/ntpdate 192.168.52.100

六、安装jdk

#1.查看自带的openjdk
$ rpm -qa | grep java

#2.卸载系统自带的openjdk
$ rpm -e --nodeps java-1.6.0-openjdk-1.6.0.41-1.13.13.1.el6_8.x86_64 tzdata-java-2016j-1.el6.noarch java-1.7.0-openjdk-1.7.0.131-2.6.9.0.el6_8.x86_64 


#为了保持我们的安装环境统一和一致，我们这里创建两个约定俗称的文件夹，来进行我们的软件包的存放和软件的安装

#所有软件的安装路径
$ mkdir -p /export/servers
#所有软件压缩包的存放路径
$ mkdir -p /export/softwares

#3.上传jdk到/export/softwares路径下去，并解压
$ tar -zxvf jdk-8u141-linux-x64.tar.gz -C ../servers/

#4.配置环境变量
$ vim /etc/profile

export JAVA_HOME=/export/servers/jdk1.8.0_141
export PATH=:$JAVA_HOME/bin:$PATH

#修改完成之后记得  source /etc/profile生效
$ source /etc/profile

七、编写shell脚本一键安装jdk

#!/bin/bash

# 第一步 jdk拷贝到其他机器

for m in node02 node03
do
  scp -r /export/servers/jdk1.8.0_141 $m:/export/servers

done


# 第二步 其他机器配置环境变量

for n in node02 node03
do
  ssh $n "echo 'export JAVA_HOME=/export/servers/jdk1.8.0_141' >> /etc/profile;echo 'export PATH=:\$JAVA_HOME/bin:\$PATH' >> /etc/profile"
done

apache-hadoop安装

界面端口说明

http://node01:50070/dfshealth.html#tab-overview  #查看hdfs
http://node01:8088/cluster #查看yarn集群
http://node01:19888/jobhistory #查看历史完成的任务

apache-hadoop单机安装

apache-hadoop-2.7.5版

一、上传文件解压到指定目录

#解压到指定目录
$ tar -zxvf hadoop-2.7.5.tar.gz -C ../servers/

二、修改配置文件

/export/servers/hadoop-2.7.5/bin: #一些shell脚本
/export/servers/hadoop-2.7.5/sbin: #一些shell脚本
/export/servers/hadoop-2.7.5/etc/hadoop: #所有配置文件路径
/export/servers/hadoop-2.7.5/lib/native: #hadoop的本地库路径，本地的c程序库
	#检测hadoop的本地程序库
	$ bin/hadoop checknative
	hadoop:  true #本地库，支持使用c程序来访问hadoop
	zlib:    true #压缩库
	snappy:  false #压缩库，谷歌出品的一种压缩算法 
	lz4:     true #压缩库 
	bzip2:   false #压缩库
	
	
#配置文件说明
core-site.xml: #核心配置文件，主要定义了我们文件访问的格式 hdfs://
hadoop-env.sh: #主要配置java路径
hdfs-site.xml: #主要定义配置hdfs的相关配置
mapred-site.xml: #主要定义mapreduce相关的一些配置
slvaes: #控制节点从哪儿来datanode nodemanager在那些机器上
yarn-site: #配置resourcemanager资源调度

1.修改core-site.xml

<configuration>
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://192.168.52.100:8020</value>
	</property>
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/export/servers/hadoop-2.7.5/hadoopDatas/tempDatas</value>
	</property>
	<!--  缓冲区大小，实际工作中根据服务器性能动态调整 -->
	<property>
		<name>io.file.buffer.size</name>
		<value>4096</value>
	</property>

	<!--  开启hdfs的垃圾桶机制，删除掉的数据可以从垃圾桶中回收，单位分钟 -->
	<property>
		<name>fs.trash.interval</name>
		<value>10080</value>
	</property>
</configuration>

2.修改hdfs-site.xml

<configuration>
	<!-- NameNode存储元数据信息的路径，实际工作中，一般先确定磁盘的挂载目录，然后多个目录用，进行分割   --> 
	<!--   集群动态上下线 
	<property>
		<name>dfs.hosts</name>
		<value>/export/servers/hadoop-2.7.4/etc/hadoop/accept_host</value>
	</property>
	
	<property>
		<name>dfs.hosts.exclude</name>
		<value>/export/servers/hadoop-2.7.4/etc/hadoop/deny_host</value>
	</property>
	 -->
	 
	 <property>
			<name>dfs.namenode.secondary.http-address</name>
			<value>node01:50090</value>
	</property>

	<!--定义namenode的访问地址-->
	<property>
		<name>dfs.namenode.http-address</name>
		<value>node01:50070</value>
	</property>

	<!--主要用于存放元数据信息地址，注意这种写法，在实际工作当中一定要先确认linux的磁盘挂载在哪个路径下面，
	查看命令 df -lh 
	/datadisk
	/mnt/resource
	file:///datadisk,file:///mnt/resource
	存储元数据信息，一定要事先确定好磁盘在哪里
	存放的是fsimage元数据信息
	-->
	<property>
		<name>dfs.namenode.name.dir</name>
		<value>file:///export/servers/hadoop-2.7.5/hadoopDatas/namenodeDatas,file:///export/servers/hadoop-2.7.5/hadoopDatas/namenodeDatas2</value>
	</property>
	<!--  定义dataNode数据存储的节点位置，实际工作中，一般先确定磁盘的挂载目录，然后多个目录用，进行分割  -->
	<property>
		<name>dfs.datanode.data.dir</name>
		<value>file:///export/servers/hadoop-2.7.5/hadoopDatas/datanodeDatas,file:///export/servers/hadoop-2.7.5/hadoopDatas/datanodeDatas2</value>
	</property>
	
	<!--定义元数据的操作日志存放位置，edits的存放位置-->
	<property>
		<name>dfs.namenode.edits.dir</name>
		<value>file:///export/servers/hadoop-2.7.5/hadoopDatas/nn/edits</value>
	</property>
	
	<!--元数据检测点保存位置-->
	<property>
		<name>dfs.namenode.checkpoint.dir</name>
		<value>file:///export/servers/hadoop-2.7.5/hadoopDatas/snn/name</value>
	</property>
	<!--edits文件的检查点保存位置-->
	<property>
		<name>dfs.namenode.checkpoint.edits.dir</name>
		<value>file:///export/servers/hadoop-2.7.5/hadoopDatas/dfs/snn/edits</value>
	</property>

	<!--文件的副本数，一个文件保存多少份-->
	<property>
		<name>dfs.replication</name>
		<value>3</value>
	</property>
	<!--hdfs的权限控制-->
	<property>
		<name>dfs.permissions</name>
		<value>false</value>
	</property>
	<!--文件存储的block块大小-->
	<property>
		<name>dfs.blocksize</name>
		<value>134217728</value>
	</property>
</configuration>

3.修改hadoop-env.sh

把
	export JAVA_HOME=${JAVA_HOME}
修改成
	export JAVA_HOME=/export/servers/jdk1.8.0_141

4.修改mapred-site.xml

把mapred-site.xml.template 改成 mapred-site.xml

<configuration>
	<!--指定mapreduce运行在yarn集群上面-->
	<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>
	<!--开启mapreduce的小任务模式-->
	<property>
		<name>mapreduce.job.ubertask.enable</name>
		<value>true</value>
	</property>
	<!--配置mapreduce的jobhistory 可以查看所有运行完成的任务的一些情况-->
	<property>
		<name>mapreduce.jobhistory.address</name>
		<value>node01:10020</value>
	</property>

	<property>
		<name>mapreduce.jobhistory.webapp.address</name>
		<value>node01:19888</value>
	</property>
</configuration>

5.修改yarn-site.xml

<configuration>
	<!--指定resourcemanager运行在那台机器上-->
	<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>node01</value>
	</property>
	<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>
	
	<!--日志的聚合功能，方便我们查看任务执行完成之后的日志记录-->
	<property>
		<name>yarn.log-aggregation-enable</name>
		<value>true</value>
	</property>
	<!--聚合日志的保存时长-->
	<property>
		<name>yarn.log-aggregation.retain-seconds</name>
		<value>604800</value>
	</property>
</configuration>

6.修改mapred-env.sh

export JAVA_HOME=/export/servers/jdk1.8.0_141

7.修改slaves

localhost

三、启动操作

1.创建文件夹

$ cd  /export/servers/hadoop-2.7.5
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/tempDatas
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/namenodeDatas
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/namenodeDatas2
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/datanodeDatas
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/datanodeDatas2
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/nn/edits
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/snn/name
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/dfs/snn/edits

2.执行格式化操作

$ cd  /export/servers/hadoop-2.7.5/

#依次顺序启动

$ bin/hdfs namenode -format

$ sbin/start-dfs.sh

$ sbin/start-yarn.sh

$ sbin/mr-jobhistory-daemon.sh start historyserver

apache-伪分布式环境搭建

适用于学习测试开发集群模式

服务规划

服务器IP	192.168.52.100	192.168.52.110	192.168.52.120
主机名	node01.hadoop.com	node02.hadoop.com	node03.hadoop.com
NameNode	是	否	否
Secondary NameNode	是	否	否
dataNode	是	是	是
ResourceManager	是	否	否
NodeManager	是	是	是

1.停止单节点集群，删除/export/servers/hadoop-2.7.5/hadoopDatas文件夹，然后重新创建文件夹

第一台机器执行以下命令

cd /export/servers/hadoop-2.7.5

sbin/stop-dfs.sh
sbin/stop-yarn.sh
sbin/mr-jobhistory-daemon.sh stop historyserver

2.删除hadoopDatas然后重新创建文件夹

rm  -rf  /export/servers/hadoop-2.7.5/hadoopDatas

3.重新创建文件夹

mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/tempDatas
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/namenodeDatas
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/namenodeDatas2
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/datanodeDatas
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/datanodeDatas2
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/nn/edits
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/snn/name
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/dfs/snn/edits

4.修改slaves文件，然后将安装包发送到其他机器，重新启动集群即可

第一台机器执行以下命令

cd  /export/servers/hadoop-2.7.5/etc/hadoop

vim slaves

node01
node02
node03

5.安装包的分发

第一台机器执行以下命令

cd  /export/servers/

scp -r hadoop-2.7.5 node02:$PWD
scp -r hadoop-2.7.5 node03:$PWD

6.启动集群

第一台机器执行以下命令

cd  /export/servers/hadoop-2.7.5

bin/hdfs namenode -format
sbin/start-dfs.sh
sbin/start-yarn.sh
sbin/mr-jobhistory-daemon.sh start historyserver

apache-分布式环境搭建

使用完全分布式，实现namenode高可用，ResourceManager的高可用

服务规划

	192.168.1.100	192.168.1.110	192.168.1.120
zookeeper	zk	zk	zk
HDFS	JournalNode	JournalNode	JournalNode
	NameNode	NameNode
	ZKFC	ZKFC
	DataNode	DataNode	DataNode
YARN		ResourceManager	ResourceManager
	NodeManager	NodeManager	NodeManager
MapReduce			JobHistoryServer

一、安装包解压

停止之前的hadoop集群的所有服务，并删除所有机器的hadoop安装包，然后重新解压hadoop压缩包

解压压缩包

第一台机器执行以下命令进行解压

cd /export/softwares
tar -zxvf hadoop-2.7.5.tar.gz -C ../servers/

二、修改配置文件

在第一台机器上执行

1.core-site.xml

<configuration>
<!-- 指定NameNode的HA高可用的zk地址  -->
	<property>
		<name>ha.zookeeper.quorum</name>
		<value>node01:2181,node02:2181,node03:2181</value>
	</property>
 <!-- 指定HDFS访问的域名地址 
	使用命名空间来定义我们的hdfs的访问地址 
-->
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://ns</value>
	</property>
 <!-- 临时文件存储目录  -->
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/export/servers/hadoop-2.7.5/data/tmp</value>
	</property>
	 <!-- 开启hdfs垃圾箱机制，指定垃圾箱中的文件七天之后就彻底删掉
			单位为分钟
	 -->
	<property>
		<name>fs.trash.interval</name>
		<value>10080</value>
	</property>
</configuration>

2.hadoop-env.sh

export JAVA_HOME=/export/servers/jdk1.8.0_141

3.hdfs-site.xml

<configuration>
<!--  指定命名空间  -->
	<property>
		<name>dfs.nameservices</name>
		<value>ns</value>
	</property>
<!--  指定该命名空间下的两个机器作为我们的NameNode  -->
	<property>
		<name>dfs.ha.namenodes.ns</name>
		<value>nn1,nn2</value>
	</property>

	<!-- 配置第一台服务器的namenode通信地址  -->
	<property>
		<name>dfs.namenode.rpc-address.ns.nn1</name>
		<value>node01:8020</value>
	</property>
	<!--  配置第二台服务器的namenode通信地址  -->
	<property>
		<name>dfs.namenode.rpc-address.ns.nn2</name>
		<value>node02:8020</value>
	</property>
	<!-- 所有从节点之间相互通信端口地址 -->
	<property>
		<name>dfs.namenode.servicerpc-address.ns.nn1</name>
		<value>node01:8022</value>
	</property>
	<!-- 所有从节点之间相互通信端口地址 -->
	<property>
		<name>dfs.namenode.servicerpc-address.ns.nn2</name>
		<value>node02:8022</value>
	</property>
	
	<!-- 第一台服务器namenode的web访问地址  -->
	<property>
		<name>dfs.namenode.http-address.ns.nn1</name>
		<value>node01:50070</value>
	</property>
	<!-- 第二台服务器namenode的web访问地址  -->
	<property>
		<name>dfs.namenode.http-address.ns.nn2</name>
		<value>node02:50070</value>
	</property>
	
	<!-- journalNode的访问地址，注意这个地址一定要配置 -->
	<property>
		<name>dfs.namenode.shared.edits.dir</name>
		<value>qjournal://node01:8485;node02:8485;node03:8485/ns1</value>
	</property>
	<!--  指定故障自动恢复使用的哪个java类 -->
	<property>
		<name>dfs.client.failover.proxy.provider.ns</name>
		<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
	</property>
	
	<!-- 故障转移使用的哪种通信机制 -->
	<property>
		<name>dfs.ha.fencing.methods</name>
		<value>sshfence</value>
	</property>
	
	<!-- 指定通信使用的公钥  
	如果使用hadoop普通用户  /home/hadoop/.ssh/id_rsa
	-->
	<property>
		<name>dfs.ha.fencing.ssh.private-key-files</name>
		<value>/root/.ssh/id_rsa</value>
	</property>
	<!-- journalNode数据存放地址  -->
	<property>
		<name>dfs.journalnode.edits.dir</name>
		<value>/export/servers/hadoop-2.7.5/data/dfs/jn</value>
	</property>
	<!-- 启用自动故障恢复功能 -->
	<property>
		<name>dfs.ha.automatic-failover.enabled</name>
		<value>true</value>
	</property>
	<!-- namenode产生的文件存放路径 -->
	<property>
		<name>dfs.namenode.name.dir</name>
		<value>file:///export/servers/hadoop-2.7.5/data/dfs/nn/name</value>
	</property>
	<!-- edits产生的文件存放路径 -->
	<property>
		<name>dfs.namenode.edits.dir</name>
		<value>file:///export/servers/hadoop-2.7.5/data/dfs/nn/edits</value>
	</property>
	<!-- dataNode文件存放路径 -->
	<property>
		<name>dfs.datanode.data.dir</name>
		<value>file:///export/servers/hadoop-2.7.5/data/dfs/dn</value>
	</property>
	<!-- 关闭hdfs的文件权限 -->
	<property>
		<name>dfs.permissions</name>
		<value>false</value>
	</property>
	<!-- 指定block文件块的大小 128M-->
	<property>
		<name>dfs.blocksize</name>
		<value>134217728</value>
	</property>
</configuration>

4.mapred-site.xml

注意：mapred-site.xml.template   修改为   mapred-site.xml


<configuration>
<!--指定运行mapreduce的环境是yarn -->
<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
</property>
<!-- MapReduce JobHistory Server IPC host:port -->
<property>
        <name>mapreduce.jobhistory.address</name>
        <value>node03:10020</value>
</property>
<!-- MapReduce JobHistory Server Web UI host:port -->
<property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>node03:19888</value>
</property>
<!-- The directory where MapReduce stores control files.默认 ${hadoop.tmp.dir}/mapred/system -->
<property>
        <name>mapreduce.jobtracker.system.dir</name>
        <value>/export/servers/hadoop-2.7.5/data/system/jobtracker</value>
</property>
<!-- The amount of memory to request from the scheduler for each map task. 默认 1024-->
<property>
        <name>mapreduce.map.memory.mb</name>
        <value>1024</value>
</property>
<!-- <property>
                <name>mapreduce.map.java.opts</name>
                <value>-Xmx1024m</value>
        </property> -->
<!-- The amount of memory to request from the scheduler for each reduce task. 默认 1024-->
<property>
        <name>mapreduce.reduce.memory.mb</name>
        <value>1024</value>
</property>
<!-- <property>
               <name>mapreduce.reduce.java.opts</name>
               <value>-Xmx2048m</value>
        </property> -->
<!-- 用于存储文件的缓存内存的总数量，以兆字节为单位。默认情况下，分配给每个合并流1MB，给个合并流应该寻求最小化。默认值100-->
<property>
        <name>mapreduce.task.io.sort.mb</name>
        <value>100</value>
</property>
 
<!-- <property>
        <name>mapreduce.jobtracker.handler.count</name>
        <value>25</value>
        </property>-->
<!-- 整理文件时用于合并的流的数量。这决定了打开的文件句柄的数量。默认值10-->
<property>
        <name>mapreduce.task.io.sort.factor</name>
        <value>10</value>
</property>
<!-- 默认的并行传输量由reduce在copy(shuffle)阶段。默认值5-->
<property>
        <name>mapreduce.reduce.shuffle.parallelcopies</name>
        <value>25</value>
</property>
<property>
        <name>yarn.app.mapreduce.am.command-opts</name>
        <value>-Xmx1024m</value>
</property>
<!-- MR AppMaster所需的内存总量。默认值1536-->
<property>
        <name>yarn.app.mapreduce.am.resource.mb</name>
        <value>1536</value>
</property>
<!-- MapReduce存储中间数据文件的本地目录。目录不存在则被忽略。默认值${hadoop.tmp.dir}/mapred/local-->
<property>
        <name>mapreduce.cluster.local.dir</name>
        <value>/export/servers/hadoop-2.7.5/data/system/local</value>
</property>
</configuration>

5.slaves

6.yarn-site.xml 注意: node03与node02配置不同

<configuration>
<!-- Site specific YARN configuration properties -->
<!-- 是否启用日志聚合.应用程序完成后,日志汇总收集每个容器的日志,这些日志移动到文件系统,例如HDFS. -->
<!-- 用户可以通过配置"yarn.nodemanager.remote-app-log-dir"、"yarn.nodemanager.remote-app-log-dir-suffix"来确定日志移动到的位置 -->
<!-- 用户可以通过应用程序时间服务器访问日志 -->

<!-- 启用日志聚合功能，应用程序完成后，收集各个节点的日志到一起便于查看 -->
	<property>
			<name>yarn.log-aggregation-enable</name>
			<value>true</value>
	</property>
 

<!--开启resource manager HA,默认为false--> 
<property>
        <name>yarn.resourcemanager.ha.enabled</name>
        <value>true</value>
</property>
<!-- 集群的Id，使用该值确保RM不会做为其它集群的active -->
<property>
        <name>yarn.resourcemanager.cluster-id</name>
        <value>mycluster</value>
</property>
<!--配置resource manager  命名-->
<property>
        <name>yarn.resourcemanager.ha.rm-ids</name>
        <value>rm1,rm2</value>
</property>
<!-- 配置第一台机器的resourceManager -->
<property>
        <name>yarn.resourcemanager.hostname.rm1</name>
        <value>node03</value>
</property>
<!-- 配置第二台机器的resourceManager -->
<property>
        <name>yarn.resourcemanager.hostname.rm2</name>
        <value>node02</value>
</property>

<!-- 配置第一台机器的resourceManager通信地址 -->
<property>
        <name>yarn.resourcemanager.address.rm1</name>
        <value>node03:8032</value>
</property>
    <!--调度任务通信地址-->
<property>
        <name>yarn.resourcemanager.scheduler.address.rm1</name>
        <value>node03:8030</value>
</property>
    <!--资源追踪-->
<property>
        <name>yarn.resourcemanager.resource-tracker.address.rm1</name>
        <value>node03:8031</value>
</property>
    <!--admin的管理地址-->
<property>
        <name>yarn.resourcemanager.admin.address.rm1</name>
        <value>node03:8033</value>
</property>
    <!--界面地址-->
<property>
        <name>yarn.resourcemanager.webapp.address.rm1</name>
        <value>node03:8088</value>
</property>

<!-- 配置第二台机器的resourceManager通信地址 -->
<property>
        <name>yarn.resourcemanager.address.rm2</name>
        <value>node02:8032</value>
</property>
<property>
        <name>yarn.resourcemanager.scheduler.address.rm2</name>
        <value>node02:8030</value>
</property>
<property>
        <name>yarn.resourcemanager.resource-tracker.address.rm2</name>
        <value>node02:8031</value>
</property>
<property>
        <name>yarn.resourcemanager.admin.address.rm2</name>
        <value>node02:8033</value>
</property>
<property>
        <name>yarn.resourcemanager.webapp.address.rm2</name>
        <value>node02:8088</value>
</property>
<!--开启resourcemanager自动恢复功能-->
<property>
        <name>yarn.resourcemanager.recovery.enabled</name>
        <value>true</value>
</property>
<!--在node03上配置rm1,在node2上配置rm2,注意：一般都喜欢把配置好的文件远程复制到其它机器上，但这个在YARN的另一个机器上一定要修改，其他机器上不配置此项
注意：现在有两个resourceManager  第三台是rm1   第二台是rm2 这个配置一定去node02上面改好-->
	<property>       
		<name>yarn.resourcemanager.ha.id</name>
		<value>rm1</value>
       <description>If we want to launch more than one RM in single node, we need this configuration</description>
	</property>
	   
	   <!--用于持久存储的类。尝试开启-->
<property>
        <name>yarn.resourcemanager.store.class</name>
        <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>
<property>
        <name>yarn.resourcemanager.zk-address</name>
        <value>node02:2181,node03:2181,node01:2181</value>
        <description>For multiple zk services, separate them with comma</description>
</property>
<!--开启resourcemanager故障自动切换，指定机器--> 
<property>
        <name>yarn.resourcemanager.ha.automatic-failover.enabled</name>
        <value>true</value>
        <description>Enable automatic failover; By default, it is enabled only when HA is enabled.</description>
</property>
<property>
        <name>yarn.client.failover-proxy-provider</name>
        <value>org.apache.hadoop.yarn.client.ConfiguredRMFailoverProxyProvider</value>
</property>
<!-- 允许分配给一个任务最大的CPU核数，默认是8 -->
<property>
        <name>yarn.nodemanager.resource.cpu-vcores</name>
        <value>4</value>
</property>
<!-- 每个节点可用内存,单位MB -->
<property>
        <name>yarn.nodemanager.resource.memory-mb</name>
        <value>512</value>
</property>
<!-- 单个任务可申请最少内存，默认1024MB -->
<property>
        <name>yarn.scheduler.minimum-allocation-mb</name>
        <value>512</value>
</property>
<!-- 单个任务可申请最大内存，默认8192MB -->
<property>
        <name>yarn.scheduler.maximum-allocation-mb</name>
        <value>512</value>
</property>
<!--多长时间聚合删除一次日志 此处-->
<property>
        <name>yarn.log-aggregation.retain-seconds</name>
        <value>2592000</value><!--30 day-->
</property>
<!--时间在几秒钟内保留用户日志。只适用于如果日志聚合是禁用的-->
<property>
        <name>yarn.nodemanager.log.retain-seconds</name>
        <value>604800</value><!--7 day-->
</property>
<!--指定文件压缩类型用于压缩汇总日志-->
<property>
        <name>yarn.nodemanager.log-aggregation.compression-type</name>
        <value>gz</value>
</property>
<!-- nodemanager本地文件存储目录-->
<property>
        <name>yarn.nodemanager.local-dirs</name>
        <value>/export/servers/hadoop-2.7.5/yarn/local</value>
</property>
<!-- resourceManager  保存最大的任务完成个数 -->
<property>
        <name>yarn.resourcemanager.max-completed-applications</name>
        <value>1000</value>
</property>
<!-- 逗号隔开的服务列表，列表名称应该只包含a-zA-Z0-9_,不能以数字开始-->
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
</property>

<!--rm失联后重新链接的时间--> 
<property>
        <name>yarn.resourcemanager.connect.retry-interval.ms</name>
        <value>2000</value>
</property>
</configuration>

三、复制创建文件夹

将第一台机器的安装包发送到其他机器上

cd /export/servers
scp -r hadoop-2.7.5/ node02:$PWD
scp -r hadoop-2.7.5/ node03:$PWD

三台机器上共同创建目录

三台机器执行以下命令

mkdir -p /export/servers/hadoop-2.7.5/data/dfs/nn/name
mkdir -p /export/servers/hadoop-2.7.5/data/dfs/nn/edits
mkdir -p /export/servers/hadoop-2.7.5/data/dfs/nn/name
mkdir -p /export/servers/hadoop-2.7.5/data/dfs/nn/edits

四、更改node02的rm2

cd /export/servers/hadoop-2.7.5/etc/hadoop
vim  yarn-site.xml



<property>       
	<name>yarn.resourcemanager.ha.id</name>
	<value>rm1</value><!--rm1改成rm2-->
    <description>If we want to launch more than one RM in single node, we need this configuration</description>
</property>

五、启动HDFS过程

1.node01机器执行以下命令

cd   /export/servers/hadoop-2.7.5

bin/hdfs zkfc -formatZK #格式化
sbin/hadoop-daemons.sh start journalnode
bin/hdfs namenode -format
bin/hdfs namenode -initializeSharedEdits -force
sbin/start-dfs.sh

2.node02上面执行，启动namenode

cd   /export/servers/hadoop-2.7.5

bin/hdfs namenode -bootstrapStandby
sbin/hadoop-daemon.sh start namenode

3.启动yarn过程

node03上面执行

cd   /export/servers/hadoop-2.7.5

sbin/start-yarn.sh

node02上执行

cd   /export/servers/hadoop-2.7.5

sbin/start-yarn.sh

4.查看resourceManager状态

node03上面执行

cd   /export/servers/hadoop-2.7.5

bin/yarn rmadmin -getServiceState rm1

node02上面执行

cd   /export/servers/hadoop-2.7.5

bin/yarn rmadmin -getServiceState rm2

5.node03启动jobHistory

node03机器执行以下命令启动jobHistory

cd /export/servers/hadoop-2.7.5

sbin/mr-jobhistory-daemon.sh start historyserver

界面url地址

hdfs状态查看

node01机器查看hdfs状态

http://192.168.52.100:50070/dfshealth.html#tab-overview

node02机器查看hdfs状态

http://192.168.52.110:50070/dfshealth.html#tab-overview

yarn集群访问查看

http://node03:8088/cluster

历史任务浏览界面

页面访问：

http://192.168.52.120:19888/jobhistory

CDH-hadoop安装

CDH-伪分布式环境搭建

服务器IP	192.168.52.100	192.168.52.110	192.168.52.120
HDFS	NameNode
	Secondary NameNode
	DataNode	DataNode	DataNode
YARN	ResourceManager
	NodeManager	NodeManager	NodeManager
MapReduce	JobHistoryServer

一、上传压缩包并解压

将我们重新编译之后支持snappy压缩的hadoop包上传到第一台服务器并解压

第一台机器执行以下命令

cd /export/softwares/

mv hadoop-2.6.0-cdh5.14.0-自己编译后的版本.tar.gz hadoop-2.6.0-cdh5.14.0.tar.gz
tar -zxvf hadoop-2.6.0-cdh5.14.0.tar.gz -C ../servers/

二、查看hadoop压缩方式及本地库

第一台机器执行以下命令

cd /export/servers/hadoop-2.6.0-cdh5.14.0

bin/hadoop checknative

如果出现openssl为false，那么所有机器在线安装openssl即可，执行以下命令，虚拟机联网之后就可以在线进行安装了

yum -y install openssl-devel

三、修改配置文件

第一台机器执行以下命令

cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop

1.core-site.xml

<configuration>
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://node01:8020</value>
	</property>
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/tempDatas</value>
	</property>
	<!--  缓冲区大小，实际工作中根据服务器性能动态调整 -->
	<property>
		<name>io.file.buffer.size</name>
		<value>4096</value>
	</property>

	<!--  开启hdfs的垃圾桶机制，删除掉的数据可以从垃圾桶中回收，单位分钟 -->
	<property>
		<name>fs.trash.interval</name>
		<value>10080</value>
	</property>
</configuration>

2.hdfs-site.xml

<configuration>
	<!-- NameNode存储元数据信息的路径，实际工作中，一般先确定磁盘的挂载目录，然后多个目录用，进行分割   --> 
	<!--   集群动态上下线 
	<property>
		<name>dfs.hosts</name>
		<value>/export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/accept_host</value>
	</property>
	
	<property>
		<name>dfs.hosts.exclude</name>
		<value>/export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/deny_host</value>
	</property>
	 -->
	 
	 <property>
			<name>dfs.namenode.secondary.http-address</name>
			<value>node01:50090</value>
	</property>

	<property>
		<name>dfs.namenode.http-address</name>
		<value>node01:50070</value>
	</property>
	<property>
        <!--实际工作当中，这个路径不能随便写，需要首先确定磁盘的挂载目录
		df -lh 查看我们磁盘的挂载路径-->
		<name>dfs.namenode.name.dir</name>
		<value>file:///export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/namenodeDatas</value>
	</property>
	<!--  定义dataNode数据存储的节点位置，实际工作中，一般先确定磁盘的挂载目录，然后多个目录用，进行分割  -->
	<property>
		<name>dfs.datanode.data.dir</name>
		<value>file:///export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/datanodeDatas</value>
	</property>
	
	<property>
		<name>dfs.namenode.edits.dir</name>
		<value>file:///export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/dfs/nn/edits</value>
	</property>
	<property>
		<name>dfs.namenode.checkpoint.dir</name>
		<value>file:///export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/dfs/snn/name</value>
	</property>
	<property>
		<name>dfs.namenode.checkpoint.edits.dir</name>
		<value>file:///export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/dfs/nn/snn/edits</value>
	</property>
	<property>
		<name>dfs.replication</name>
		<value>3</value>
	</property>
	<property>
		<name>dfs.permissions</name>
		<value>false</value>
	</property>
<property>
		<name>dfs.blocksize</name>
		<value>134217728</value>
	</property>
</configuration>

3.hadoop-env.sh

export JAVA_HOME=/export/servers/jdk1.8.0_141

4.mapred-site.xml

<configuration>
	<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>

	<property>
		<name>mapreduce.job.ubertask.enable</name>
		<value>true</value>
	</property>
	
	<property>
		<name>mapreduce.jobhistory.address</name>
		<value>node01:10020</value>
	</property>

	<property>
		<name>mapreduce.jobhistory.webapp.address</name>
		<value>node01:19888</value>
	</property>
</configuration>

5.yarn-site.xml

<configuration>
	<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>node01</value>
	</property>
	<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>
	
	<property>
		<name>yarn.log-aggregation-enable</name>
		<value>true</value>
	</property>
	<property>
		<name>yarn.log-aggregation.retain-seconds</name>
		<value>604800</value>
	</property>
</configuration>

6.slaves

node01
node02
node03

四、创建文件存放目录

第一台机器执行以下命令

node01机器上面创建以下目录

mkdir -p /export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/tempDatas
mkdir -p /export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/namenodeDatas
mkdir -p /export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/datanodeDatas 
mkdir -p /export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/dfs/nn/edits
mkdir -p /export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/dfs/snn/name
mkdir -p /export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/dfs/nn/snn/edits

五、安装包的分发

第一台机器执行以下命令

cd /export/servers/

scp -r hadoop-2.6.0-cdh5.14.0/ node02:$PWD
scp -r hadoop-2.6.0-cdh5.14.0/ node03:$PWD

六、配置hadoop的环境变量

三台机器都要进行配置hadoop的环境变量

三台机器执行以下命令

vim  /etc/profile

export HADOOP_HOME=/export/servers/hadoop-2.6.0-cdh5.14.0
export PATH=:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

配置完成之后生效

source /etc/profile

七、集群启动

要启动 Hadoop 集群，需要启动 HDFS 和 YARN 两个集群。

注意：首次启动HDFS时，必须对其进行格式化操作。本质上是一些清理和准备工作，因为此时的 HDFS 在物理上还是不存在的。

搭建好了后，第一次需要进行格式化，以后都不要再格式化了，格式化后数据就没有了

bin/hdfs namenode  -format 或者 bin/hadoop namenode –format

单个节点逐一启动

#在主节点上使用以下命令启动 HDFS NameNode： 
hadoop-daemon.sh start namenode 

#在每个从节点上使用以下命令启动 HDFS DataNode： 
hadoop-daemon.sh start datanode 

#启动主节点 secondarynamenode
hadoop-daemon.sh start secondarynamenode

#在主节点上使用以下命令启动 YARN ResourceManager： 
yarn-daemon.sh  start resourcemanager 

#在每个从节点上使用以下命令启动 YARN nodemanager： 
yarn-daemon.sh start nodemanager

#启动主节点 JobHistoryServer
mr-jobhistory-daemo.sh start historyserver

#以上脚本位于$HADOOP_PREFIX/sbin/目录下。如果想要停止某个节点上某个角色，只需要把命令中的start 改为stop 即可。

脚本一键启动

如果配置了 etc/hadoop/slaves 和ssh 免密登录，则可以使用程序脚本启动所有Hadoop两个集群的相关进程，在主节点所设定的机器上执行。

启动集群

node01节点上执行以下命令

第一台机器执行以下命令

cd /export/servers/hadoop-2.6.0-cdh5.14.0/

sbin/start-dfs.sh
sbin/start-yarn.sh
sbin/mr-jobhistory-daemon.sh start historyserver

停止集群：没事儿不要去停止集群

sbin/stop-dfs.sh
sbin/stop-yarn.sh
sbin/mr-jobhistory-daemon.sh start historyserver