1.群集的概念
1.1群集的含义
- Cluster,集群、群集
- 由多台主机构成,但对外只表现为一一个整体,只提供一-个访问入口(域名或IP地址), 相当于一台大型计算机。
1.2使用群集的原因
互联网应用中,随着站点对硬件性能、响应速度、服务稳定性、数据可靠性等要求越来越高,单台服务器已经无法满足负载均衡及高可用的要求。
解决方法;
- 使用价格昂贵的小型机、大型机。(纵向扩容)
- 使用多台相对廉价的普通服务器构建服务群集。(横向扩容)
LVS群集技术:
- 在企业中常用的一种群集技术一LVS (Linux Virtual Server, Linux虚拟服务器)
- 通过整合多台服务器,使用LVS来达到服务器的高可用和负载均衡,并以同一个IP地址对外提供相同的服务。
1.3群集的目的
- 提高性能:计算密集应用。如天气预报,核试验模拟。
- 降低成本:相对百万美元的超级计算机,价格便宜。
- 提高可扩展性:只要增加集群节点即可。
- 增强可靠性:多个节点完成相同功能,避免单点失败。
2.企业群集的分类
根据群集所针对的目标差异,可分为三种类型:
- 负载均衡群集
- 高可用群集
- 高性能运算群集
2.1负载均衡群集(Load Balance Cluster)
- 提高应用系统的响应能力、尽可能处理更多的访问请求、减少延迟为目标,获得高并发、负载(LB)的整体性能;
- LB的负载分配依赖于主节点的分流算法,将来自客户机的访问请求分担给多个服务器节点,从而缓解整个系统的负载压力。例如,“DNS轮询”、“反向代理” 等。
2.2 高可用群集(High Availability Cluster)
-
提高应用系统的可靠性、尽可能地减少中断时间为目标,确保服务的连续性,达到高可用(HA) 的容错效果。
-
HA的工作方式包括双工和主从两种模式,双工即所有节点同时在线;主从则只有主节点在线,但当出现故障时从节点能自动切换为主节点。例如,“故障切换” 、“双机热备” 等。
2.3 高性能运算群集(High Performance Computer Cluster)
-
以提高应用系统的CPU运算速度、扩展硬件资源和分析能力为目标,获得相当于大型、超级计算机的高性能运算(HPC)能力。
-
高性能依赖于"分布式运算”、 “并行计算”,通过专用硬件和软件将多个服务器的CPU、内存等资源整合在一起,实现只有大型、超级计算机才具备的计算能力。例如,'云计算”、 “网格计算”等。
3.负载均衡集群
3.1负载均衡群集架构
第一层 负载调度器(Load Balancer或Director) 负载均衡层
访问整个群集系统的唯一入口,对外使用所有服务器共有的VIP地址,也称为群集 IP地址。通常会配置主、备两台调度器实现热备份,当主调度器失效以后能够平滑 替换至备用调度器,确保高可用性。
第二层 服务器池(Server Pool) WEB应用层
群集所提供的应用服务、由服务器池承担,其中每个节点具有独立的RIP地址(真 实IP),只处理调度器分发过来的客户机请求。当某个节点暂时失效时,负载调度 器的容错机制会将其隔离,等待错误排除以后再重新纳入服务器池。
第三层 共享存储(Share Storage) 确保多台服务器使用的是相同的资源
为服务器池中的所有节点提供稳定、一致的文件存取服务,确保整个群集的统一性 共享存储可以使用NAS设备,或者提供NFS共享服务的专用服务器。
(因为节点服务器的资源都是由NAS或NFS提供,所以NAS或NFS需要做主备、或分布式,从而实现高可用。)
3.2负载均衡群集的工作模式
群集的负载调度技术有三种工作模式:
- 1、地址转换(NAT模式)
- 2、IP隧道(IP-TUN)
- 3、直接路由(DR模式)
通常使用 NAT和DR,使用最多的是DR模式。
3.2.1 NAT模式(地址转换)
-
Network Address Translation,简称NAT模式
-
类似于防火墙的私有网络结构,负载调度器作为所有服务器节点的网关,即作为客户机 的访问入口,也是各节点回应客户机的访问出口。
-
服务器节点使用私有IP地址,与负载调度器位于同一个物理网络,安全性要优于其他两 种方式。
-
缺点:由于NAT的负载均衡器既作为用户的访问请求入口,也作为节点服务器响应请求的出口,承载两个方向的压力,调度器的性能会成为整个集群的瓶颈。
3.2.2 TUN模式 (ip隧道)
-
IP Tunnel ,简称TUN模式。
-
采用开放式的网络结构,负载调度器仅作为客户机的访问入口,各节点通过各自的Internet连接直接回应客户机,而不再经过负载调度器。承载的压力比NAT小。
-
服务器节点分散在互联网中的不同位置,具有独立的公网IP地址,通过专用IP隧道与负载调度器相互通信。
-
缺点:成本很高。
-
这种模式一般应用于特殊场景,比如将节点服务器分布在全国各地,防止被物理攻击(如地震、战争等),做灾备。
3.2.3 DR模式(直连路由)
-
Direct Routing,简称DR模式。
-
采用半开放式的网络结构,与TUN模式的结构类似,负载调度器仅作为客户机的访问入口,各节点通过各自的Internet连接直接回应客户机,而不再经过负载调度器。承载的压力比NAT小。
-
但各节点并不是分散在各地,而是与调度器位于同一个物理网络。
-
负载调度器与各节点服务器通过本地网络连接,不需要建立专用的IP隧道。
DR模式的特点:
(1)Director Server 和 Real Server 必须在同一个物理网络中。
(2)Real Server 可以使用私有地址,也可以使用公网地址。如果使用公网地址,可以通过互联网对 RIP 进行直接访问。
(3)Director Server作为群集的访问入口,但不作为网关使用。
(4)所有的请求报文经由 Director Server,但回复响应报文不能经过 Director Server。
(5)Real Server 的网关不允许指向 Director Server IP,即Real Server发送的数据包不允许经过 Director Server。
(6)Real Server 上的 lo 接口配置 VIP 的 IP 地址。
4.LVS虚拟服务器
4.1 LVA 虚拟服务器的简介
Linux Virtual Server:
-
针对Linux内核开发的负载均衡
-
1998年5月,由我国的章文嵩博士创建
-
LVS实际上相当于基于IP地址的虚拟化应用,为基于IP地址和内容请求分发的负载均衡提出来一种高效的解决方法
4.2 LVS相关术语
DS:Director Server。指的是前端负载均衡器。
RS:Real Server。节点服务器,后端真实的工作服务器。
VIP:向外部直接面向用户请求,作为用户请求的目标的IP地址。
DIP:Director Server IP,主要用于和内部主机通讯的IP地址。
RIP:Real Server IP,后端服务器的IP地址。
CIP:Client IP,访问客户端的IP地址。
4.3 LVS的负载调度算法
4.3.1 固定调度算法 rr,wr dh,sh
rr:轮询算法(Round Robin)
- 将请求依次分配给不同的RS节点,即RS节点中均摊分配。适合于RS所有节点处理性能接近的情况。
- 将收到的访问请求安装顺序轮流分配给群集指定各节点(真实服务器),均等地对待每一台服务器,而不管服务器实际的连接数和系统负载。
wrr:加权轮询调度(Weighted Round Robin)
- 依据不同RS的权重值分配任务。权重值较高的RS将优先获得任务,并且分配到的连接数将比权值低的RS更多。相同权值的RS得到相同数目的连接数。
- 保证性能强的服务器承担更多的访问流量。
dh:目的地址哈希调度(destination hashing)
- 以目的地址为关键字查找一个静态hash表来获得所需RS。
sh:源地址哈希调度(source hashing)
- 以源地址为关键字查找--个静态hash表来获得需要的RS。
4.3.2 动态调度算法 lblc,lc,wlc
lc:最小连接数调度( Least Connections)
- ipvs表存储了所有活动的连接。LB会比较将连接请求发送到当前连接最少的RS。
- 根据真实服务器已建立的连接数进行分配,将收到的访问请求优先分配给连接数最少的节点。
wlc:加权最小连接数调度(Weighted Least Connections)
- 假设各台RS的权值依次为Wi,当前tcp连接数依次为Ti,依次取Ti/Wi为最小的RS作为下一个分配的RS。
- 在服务器节点的性能差异较大时,可以为真实服务器自动调整权重。
- 性能较高的节点将承担更大比例的活动连接负载。
lblc:基于地址的最小连接数调度(locality-based least-connection)
-
将来自同一个目的地址的请求分配给同一-台RS,此时这台服务器是尚未满负荷的。否则就将这个请求分配给连接数最小的RS,并以它作为下一次分配的首先考虑。
5.ipvsadm工具
ipvsadm是一个工具,同时它也是一条命令,用于管理LVS的策略规则。
ipvsadm是ipvs的管理器,需要yum安装。
ipvsadm工具的作用:
LVS群集创建与管理:
- 创建虚拟服务器
- 添加、删除服务器节点
- 查看群集及节点情况
- 保存负载分配策略
ipvsadm 命令选项说明:
| 选项 | 功能 |
|---|---|
| -A | 添加虚拟服务器 |
| -D | 删除整个虚拟服务器 |
| -s | 指定负载调度算法(轮询: rr、加权轮询: wrr、 最少连接: lc、 加权最少连接: wlc) |
| -a | 表示添加真实服务器(节点服务器) |
| -t | 指定VIP地址及TCP端口 (调度器使用) |
| -r | 指定RIP地址及TCP端口 (节点服务器使用) |
| -m | 表示使用NAT群集模式 |
| -g | 表示使用DR模式 |
| -i | 表示使用TUN模式 |
| -w | 设置权重(权重为0时表示暂停节点) ,默认值为1 |
| -p 60 | 表示保持长连接60秒。默认值就是60秒。 |
| -l | 列表查看LVS虚拟服务器(默认为查看所有) |
| -n | 以数字形式显示地址、端口等信息,常与“-l”选项组合使用。-l需要在-n之前。ipvsadm -ln |
6.LVS-NAT模式操作实例
框架内容:
网关服务器使用lvs完成nat模式的轮询负载均衡,使我们的客户机能访问轮询访问nginx网页,两台nginx服务器实现网页文件共享。
具体操作:
1.先建立共享服务器到192.168.223.100地址的服务器中建立共享文件夹
2.在/etc/exports文件下设置文件共享
/opt/lzq1 192.168.223.0/24(rw,sync,no_root_squash)
#设置读写权限,直接读到磁盘中,客户端root用户不进行降权
/opt/lzq2 192.168.223.0/24(rw,sync,no_root_squash)
3.使用showmount -e 查看自己的共享文件
4.去7-1和7-2服务器上挂载共享文件,先开启两台服务器的rpcbind和nfs
5.将原先配置文件中的内容先移出,再去进行挂载
6.使用mount 去进行挂载,两个服务器都要做
7.先自己去浏览器上测试一下自己的nginx网页是否正常
8.去设置两台服务器的长连接超时时间防止后面测试出现问题
9.去设置lvs调度服务器,7-3需要设置双网卡,先设置双网卡,并将出去的网卡地址设置为12.0.0.10
10.修改通向外网的网卡配置
11.准备一个客户端修改网卡配置,注意网关设置为网关服务器的36网卡的ip地址
12.去开启网关服务器的ip地址路由转发功能 在/etc/sysctl.conf
13.设置节点服务器的网关,都指向网关服务器ens33网卡的ip地址
14.设置调度器的ipvsadm,使内网节点服务器可以连通外网客户机,直接设置SNAT
15.加载ip_vs模块
cd /usr/lib/modules/3.10.0-693.el7.x86_64/kernel/net/netfilter/ipvs/
#进入到这个文件夹下开启模块
[root@localhost ipvs]#for i in `ls /usr/lib/modules/3.10.0-693.el7.x86_64/kernel/net/netfilter/ipvs/|grep -o "^[^.]*"`
> do
> modprobe $i
> done
#可以使用for循环进行批量启动
cat /proc/net/ip_vs 查看是否启动
16.安装ipvsadm工具
17.建立一个/etc/sysconfig/ipvsadm文件,之后启动ipvsadm
18.之后配置lvs设置
[root@localhost ipvs]#ipvsadm -C
#清除原先所有的配置
[root@localhost ipvs]#ipvsadm -A -t 12.0.0.10:80 -s rr
#添加vip地址和端口号 使用轮询调度
[root@localhost ipvs]#ipvsadm -ln
#查看自己是否添加成功
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
-> RemoteAddress:Port Forward Weight ActiveConn InActConn
TCP 12.0.0.10:80 rr
[root@localhost ipvs]#ipvsadm -a -t 12.0.0.10:80 -r 192.168.223.101:80 -m
# 设置真实后端节点服务器的路径 -m是指定nat工作模式
[root@localhost ipvs]#ipvsadm -a -t 12.0.0.10:80 -r 192.168.223.102:80 -m
ipvsadm #刷新lvs,加载配置
19.去我们的客户机上面进行测试
7.LVS -DR模式下的操作流程
实验内容:
建立负载均衡架构,使用DR模式调度器来完成nginx服务器的轮询调用
具体操作:
1.先设置7-0 为nfs共享服务器,将文件共享
2.去7-1,7-2上面进行nfs挂载,挂载到nginx可以访问的文件夹下
3.开启xshell的同步操作,一起设置两台nginx服务器,先设置虚拟vip网卡lo:0
4.为服务器添加路由
注意:
如果想永久添加路由表信息可以去/etc/rc.d/rc.loacd 文件下添加这条命令 并给这个文件加上执行权限,开机后就自动把这个路由信息添加进去了。
5.去/etc/sysctl.conf 文件下添加内核参数,并sysctl-p刷新
net.ipv4.conf.lo.arp_ignore = 1
net.ipv4.conf.lo.arp_announce = 2
net.ipv4.conf.all.arp_ignore = 1
net.ipv4.conf.all.arp_announce = 2
6.设置调度器,先安装ipvsadm
7.创建文件使ipvsadm正常启动
ipvsadm-save > /etc/sysconfig/ipvsadm
8.开启ip_vs模块
9.创建调度器的ens33的虚拟网卡ens33:0
10.去/etc/sysctl.conf关闭调度器的路由转发和重定向功能,防止节点服务器通过调度器传给客户端
net.ipv4.ip_forward = 0
net.ipv4.conf.all.send_redirects = 0
net.ipv4.conf.default.send_redirects = 0
net.ipv4.conf.ens33.send_redirects = 0
11.最后设置ipvsadm配置
[root@localhost network-scripts]#ipvsadm -C
# 先清空原先的规则
[root@localhost network-scripts]#ipvsadm -ln
# 查看是否清空规则
ipvsadm -A -t 192.168.223.200:80 -s rr
# 设置虚拟服务器网址 调度算法为轮询
[root@localhost network-scripts]#ipvsadm -a -t 192.168.223.200:80 -r 192.168.223.101:80 -g
# 使真实服务器与我们的vip地址进行关联 -g指定DR模式
[root@localhost network-scripts]#ipvsadm -a -t 192.168.223.200:80 -r 192.168.223.102:80 -g
ipvsadm #激活一下配置
12.之后去我们的浏览器测试一下 ,使用192.168.223.200测试