LVS-DR 工作原理
LVS-DR数据包流向分析
(1)客户端发送请求到Director Server (负载均衡器),请求的数据报文(源IP是CIP,目标IP是VIP)到达内核空间。
(2)Director Server 和Real Server 在同一个网络中,数据通过二层数据链路层来传输。
(3)内核空间判断数据包的目标IP是本机VIP,此时IPVS(IP虛拟服务器)比对数据包请求的服务是否是集群服务,是集群服务就重新封装数据包修改源MAC地址为Director server 的MAC地址,修改目标MAC地址为Real Server 的MAC 地址,源IP 地址与目标IP地址没有改变,然后将数据包发送给Real Server。
(4)到达Real server 的请求报文的MAC地址是自身的MAC地址,就接收此报文。数据包重新封装报文(源IP地址为VIP,目标IP为CIP),将响应报文通过lo接口传送给物理网卡然后向外发出。
(5)Real Server 直接将响应报文传送到客户端。客户端收到回复报文,认为得到正常的服务,而不会知道是哪一台服务器处理的。
注意:如果跨网段,则报文通过路由器经由Internet返回给用户。
DR模式的特点
(1)Director Server(调度器) 和 Real Server(节点服务器) 必须在同一个物理网络中。
(2)Real Server可以使用私有地址,也可以使用公网地址。如果使用公网地址,可以通过互联网对RIP进行直接访问。
(3)Director Server作为群集的访问入口,但不作为网关使用。
(4)所有的请求报文经由Director Server, 但回复响应报文不能经过Director Server。
(5) Real Server 的网关不允许指向Director Server IP, 即Real Server发送的数据包不允许经过Director Server。(RS的网关地址只能指定真实的路由器网关)
(6) Real Server 上的 lo 接口配置VIP的IP地址。
LVS-DR中的ARP问题
问题一:VIP地址相同导致响应冲突
问题原因:
在LVS-DR负载均衡集群中,负载均衡器与节点服务器都要配置相同的VIP地址,在局域网中具有相同的IP地 址,势必会造成各服务器ARP通信的紊乱。
- 当ARP广播发送到LVS-DR集群时,因为负载均衡器和节点服务器都是连接到相同的网络上,它们都会收到ARP广播。
- 只有前端的负载均衡器进行响应,其他节点服务器不应该响应ARP广播。
解决方法:
对节点服务器进行处理,使其不响应针对VIP的ARP请求
- 使用虚接口lo:0承载VIP地址
- 设置内核参数 arp_ ignore=1:系统只响应目的IP为本地IP(物理网卡的地址,而不是lo网卡的虚接口地址)的ARP请求。
2.2 问题二:返回报文时源地址使用VIP,导致网关设备的ARP缓存表紊乱
问题原因:
- RealServer返回报文(源IP是VIP)经路由器转发,重新封装报文时,需要先获取路由器的MAC地址。
- 发送ARP请求时,Linux默认使用IP包的源IP地址(即VIP)作为ARP请求包中的源IP地址,而不使用发送接口的IP地址。
- 路由器收到ARP请求后,将更新ARP表项。原有的VIP对应Director的MAC地址,会被更新为VIP对应的Real Server的MAC地址。导致网关设备的ARP缓存表紊乱。
- 路由器根据ARP表项,会将新来的请求报文转发给Real Server,导致Director的VIP失效。
解决方法:
对节点服务器进行处理,设置内核参数arp_announce=2:系统不使用IP数据包的源地址来设置ARP请求的源地址,而选择发送接口(物理网卡)的IP地址。
解决ARP的两个问题的设置方法
修改/etc/sysctl.conf 文件,调整内核的ARP响应参数。
vim /etc/sysctl.conf //添加以下四行参数
net.ipv4.conf.lo.arp_ignore = 1
net.ipv4.conf.lo.arp_announce = 2
net.ipv4.conf.all.arp_ignore = 1
net.ipv4.conf.all.arp_announce = 2
sysctl -p //刷新配置,读取修改后的配置
#arp_ignore=1 :使本机系统只响应目的IP为本地物理网卡IP的ARP请求。
#arp_announce=2:使本机系统不使用即将返回的IP数据包的源地址来作为ARP请求报文的源地址,而采用发送接口(物理网卡)的IP作为ARP请求报文源地址。
LVS-DR 负载均衡群集的部署
实验环境:
DR服务器:192.168.20.30/24
两台WEB服务器:192.168.20.20/24,192.168.72.100/24
VIP:192.168.20.200/32
NFS服务器:192.168.20.10/24
客户端:192.168.20.201/24
部署共享服务(NFS服务器:192.168.20.10)
[root@localhost ~]# systemctl stop firewalld.service
[root@localhost ~]# systemctl disable firewalld.service
[root@localhost ~]# setenforce 0
[root@localhost ~]# yum install nfs-utils rpcbind -y
[root@localhost ~]# systemctl start rpcbind.service
[root@localhost ~]# systemctl start nfs.service
[root@localhost ~]# systemctl enable nfs.service
[root@localhost ~]# systemctl enable rpcbind.service
[root@localhost ~]# mkdir /share/
[root@localhost ~]# cd /share/
[root@localhost share]# mkdir jlx can
[root@localhost ~]# echo 'this is jlx web!' > /share/jlx/index.html
[root@localhost ~]# echo 'this is can web!' > /share/can/index.html
[root@localhost ~]# vim /etc/exports
/share/jlx 192.168.20.0/24(rw,sync)
/share/can 192.168.20.0/24(rw,sync)
--发布共享---
[root@localhost ~]# exportfs -rv
[root@localhost ~]# showmount -e
部署Web节点服务器
1)配置虚拟 IP 地址(VIP:192.168.20.200)
#此地址仅用作发送 Web响应数据包的源地址,并不需要监听客户机的访问请求(改由调度器监听并分发)。因此使用虚接口 lo∶0 来承载 VIP 地址,并为本机添加一条路由记录,将访问 VIP 的数据限制在本地,以避免通信紊乱。
[root@localhost ~]# systemctl stop firewalld.service
[root@localhost ~]# setenforce 0
[root@localhost ~]# cd /etc/sysconfig/network-scripts/
[root@localhost network-scripts]# cp ifcfg-lo ifcfg-lo:0
[root@localhost network-scripts]# vim ifcfg-lo:0
DEVICE=lo:0
IPADDR=192.168.20.200
NETMASK=255.255.255.255 #注意:子网掩码必须全为 1
ONBOOT=yes
[root@localhost network-scripts]# ifup lo:0
[root@localhost network-scripts]# ifconfig lo:0
lo:0: flags=73<UP,LOOPBACK,RUNNING> mtu 65536
inet 192.168.20.200 netmask 255.255.255.255
loop txqueuelen 1 (Local Loopback)
[root@localhost network-scripts]# route add -host 192.168.20.200 dev lo:0
[root@localhost network-scripts]# vim /etc/rc.local
/sbin/route add -host 192.168.20.200 dev lo:0
[root@localhost network-scripts]# chmod +x /etc/rc.d/rc.local
(2)调整内核的 ARP 响应参数以阻止更新 VIP 的 MAC 地址,避免发生冲突
[root@localhost ~]# vim /etc/sysctl.conf
net.ipv4.conf.lo.arp_ignore = 1
net.ipv4.conf.lo.arp_announce = 2
net.ipv4.conf.all.arp_ignore = 1
net.ipv4.conf.all.arp_announce = 2
[root@localhost ~]# sysctl -p
net.ipv4.conf.lo.arp_ignore = 1
net.ipv4.conf.lo.arp_announce = 2
net.ipv4.conf.all.arp_ignore = 1
net.ipv4.conf.all.arp_announce = 2
[root@localhost ~]# yum -y install nfs-utils rpcbind httpd
[root@localhost ~]# systemctl start rpcbind
[root@localhost ~]# systemctl start httpd
--192.168.20.20--
[root@localhost ~]# mount.nfs 192.168.20.10:/share/jlx /var/www/html/
[root@localhost ~]# cat /var/www/html/index.html
this is jlx!
--192.168.20.100--
[root@www ~]#mount.nfs 192.168.20.10:/share/can /var/www/html/
[root@www ~]#cat /var/www/html/index.html
this is can!
--192.168.20.20--
配置负载调度器(192.168.20.100/24)
[root@localhost ~]# systemctl stop firewalld.service
[root@localhost ~]# setenforce 0
[root@localhost ~]# modprobe ip_vs
[root@localhost ~]# cat /proc/net/ip_vs
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
-> RemoteAddress:Port Forward Weight ActiveConn InActConn
[root@localhost ~]# yum -y install ipvsadm
1)配置虚拟 IP 地址(VIP:192.168.20.200)
[root@localhost ~]# cd /etc/sysconfig/network-scripts/
[root@localhost network-scripts]# cp ifcfg-ens33 ifcfg-ens33:0 #若隧道模式,复制为ifcfg-tunl0
[root@localhost network-scripts]# vim ifcfg-ens33:0
[root@localhost network-scripts]# ifup ens33:0
Determining if ip address 192.168.20.200 is already in use for device ens33...
RTNETLINK answers: File exists
[root@localhost network-scripts]# ifconfig ens33:0
ens33:0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500
ether 00:0c:29:a8:dd:29 txqueuelen 1000 (Ethernet)
(2)调整 proc 响应参数
#由于 LVS 负载调度器和各节点需要共用 VIP 地址,需要关闭 icmp 的重定向,不充当路由器。
[root@localhost network-scripts]# vim /etc/sysctl.conf
net.ipv4.ip_forward = 0
net.ipv4.conf.all.send_redirects = 0
net.ipv4.conf.default.send_redirects = 0
net.ipv4.conf.ens33.send_redirects = 0
[root@localhost network-scripts]# sysctl -p
net.ipv4.ip_forward = 0
net.ipv4.conf.all.send_redirects = 0
net.ipv4.conf.default.send_redirects = 0
net.ipv4.conf.ens33.send_redirects = 0
(3)配置负载分配策略
[root@localhost network-scripts]# ipvsadm-save > /etc/sysconfig/ipvsadm
[root@localhost network-scripts]# systemctl start ipvsadm
[root@localhost network-scripts]# ipvsadm -C
[root@localhost network-scripts]# ipvsadm -A -t 192.168.20.200:80 -s rr
[root@localhost network-scripts]# ipvsadm -a -t 192.168.20.200:80 -r 192.168.20.20:80 -g #若隧道模式,-g替换为-i
[root@localhost network-scripts]# ipvsadm -a -t 192.168.20.200:80 -r 192.168.20.100:80 -g
[root@localhost network-scripts]# ipvsadm
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
-> RemoteAddress:Port Forward Weight ActiveConn InActConn
TCP localhost.localdomain:http rr
-> 192.168.20.20:http Route 1 0 0
-> 192.168.20.100:http Route 1 0 0
[root@localhost network-scripts]# ipvsadm -ln #查看节点状态,Route代表 DR模式
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
-> RemoteAddress:Port Forward Weight ActiveConn InActConn
TCP 192.168.20.200:80 rr
-> 192.168.20.20:80 Route 1 0 0
-> 192.168.20.100:80 Route 1 0 0
客户机访问测试
客户机IP:192.168.20.201/24。
浏览器输入VIP地址:192.168.20.200
访问VIP,第一次访问
访问VIP,第二次访问
总结
NFS服务器配置步骤:
- 关闭防火墙
- 安装nfs-utils、rpcbind软件包
- 新建共享目录,并创建站点文件
- 修改共享配置文件,设置共享策略
- 启动两个服务,查看本机的NFS共享信息
节点服务器配置步骤:
- 关闭防火墙
- 安装httpd服务
- 配置 lo:0 虚拟网卡,承载VIP
- 添加路由 route add
- 修改内核配置,/etc/sysctl.conf
- 挂载站点(将NFS服务器的共享目录挂载到httpd的站点目录)
DR负载调度服务器的配置步骤:
-
关闭防火墙
-
加载ip_vs模块,安装ipvsadm工具
-
配置虚拟IP地址(VIP和节点服务器的VIP一致)
-
调整 proc 响应参数,关闭路由转发功能,/etc/sysctl.conf
-
配置负载分配策略