LVS负载均衡--DR模式

627 阅读10分钟

前言

DR模式 :直接路由

Snipaste_2022-10-15_16-28-26.png Direct Routing ,简称DR模式
采用半开放式的网络结构,与TUN模式的结构类似,但各节点并不是分散在各地,而是与调度器位于同一个物理网络 负载调度器与各节点服务器通过本地网络连接,不需要建立专用的IP隧道

原理:负载均衡器和RS都使用同一个IP对外服务,但只有DR对ARP请求进行响应。所有RS对本身这个IP的ARP请求保持静默也就是说,网关会把对这个服务IP的请求全部定向给DR,而DR收到数据包后根据调度算法,找出对应的RS,把目的MAC地址改为RS的MAC(因为IP一致),并将请求分发给这台RS这时RS收到这个数据包。处理完成之后,由于IP一致,可以直接将数据返给客户,则等于直接从客户端收到这个数据包无异,处理后直接返回给客户端,由于负载均衡器要对二层包头进行改换,所以负载均衡器和RS之间必须在一个广播域也可以简单的理解为在同一台交换机上

优点:和TUN(隧道模式)一样,负载均衡器也只是分发请求,应答包通过单独的路由方法返回给客户端与VS-TUN相比,VS-DR这种实现方式不需要隧道结构,因此可以使用大多数操作系统做为物理服务器。
缺点:(不能说缺点,只能说是不足)要求负载均衡器的网卡必须与物理网卡在一个物理段上。 Snipaste_2022-10-15_15-25-35.png

LVS-DR数据包流向分析

Snipaste_2022-10-16_19-55-43.png

  1. 端发送请求至VIP,也就是访问服务,请求报文源地址是CIP,目标地址为VIP;

  2. S调度器接收到请求,报文在PREROUTING链检查,确定目的IP是本机,于是将报文发送至INPUT链,ipvs内核模块确定请求的服务是我们配置的LVS集群服务,然后根据用户设定的均衡策略选择某台后端RS,并将目标MAC地址修改RIP的MAC地址。因为调度器和后端服务器RS在同个网段,因此直接二层互通,将请求发给选择的RS处理;

  3. 报文目的mac是本机,且RS上有配置VIP,因此RS能接收该报文。后端服务处理完请求后,将响应直接发往客户端,此时源IP地址为VIP,目标IP为CIP。

DR模式的特点

  • rector Server(调度器) 和 Real Server(节点服务器) 必须在同一个物理网络中。
  • al Server可以使用私有地址,也可以使用公网地址。如果使用公网地址,可以通过互联网对RIP进行直接访问。
  • rector Server作为群集的访问入口,但不作为网关使用。
  • 的请求报文经由Director Server, 但回复响应报文不能经过Director Server。
  • al Server 的网关不允许指向Director Server IP, 即Real Server发送的数据包不允许经过Director Server。(RS的网关地址只能指定真实的路由器网关)
  • al Server 上的 lo 接口配置VIP的IP地址。

LVS-DR中会遇到的ARP问题

1. VIP地址相同导致响应冲突

问题原因:在LVS-DR负载均衡集群中,负载均衡器与节点服务器都要配置相同的VIP地址,在局域网中具有相同的IP地 址,势必会造成各服务器ARP通信的紊乱。

  • 当ARP广播发送到LVS-DR集群时,因为负载均衡器和节点服务器都是连接到相同的网络上,它们都会收到ARP广播。
  • 只有前端的负载均衡器进行响应,其他节点服务器不应该响应ARP广播。

解决方法:对节点服务器进行处理,使其不响应针对VIP的ARP请求

  • 使用虚接口lo:0承载VIP地址
  • 设置内核参数 arp_ ignore=1:系统只响应目的IP为本地IP(物理网卡的地址,而不是lo网卡的虚接口地址)的ARP请求。

2. 返回报文时源地址使用VIP,导致网关设备的ARP缓存表紊乱

2.png

问题原因:

  • RealServer返回报文(源IP是VIP)经路由器转发,重新封装报文时,需要先获取路由器的MAC地址。
  • 发送ARP请求时,Linux默认使用IP包的源IP地址(即VIP)作为ARP请求包中的源IP地址,而不使用发送接口的IP地址。
  • 路由器收到ARP请求后,将更新ARP表项。原有的VIP对应Director的MAC地址,会被更新为VIP对应的Real Server的MAC地址。导致网关设备的ARP缓存表紊乱。
  • 路由器根据ARP表项,会将新来的请求报文转发给Real Server,导致Director的VIP失效。

解决方法:对节点服务器进行处理,设置内核参数arp_announce=2:系统不使用IP数据包的源地址来设置ARP请求的源地址,而选择发送接口(物理网卡)的IP地址。

解决ARP的两个问题的设置方法

修改/etc/sysctl.conf 文件,调整内核的ARP响应参数。

 vim /etc/sysctl.conf
添加以下四行参数
net.ipv4.conf.lo.arp_ignore = 1  
net.ipv4.conf.lo.arp_announce = 2
net.ipv4.conf.all.arp_ignore = 1
net.ipv4.conf.all.arp_announce = 2
刷新配置,读取修改后的配置
sysctl -p

 #arp_ignore=1 :使本机系统只响应目的IP为本地物理网卡IP的ARP请求
#arp_announce=2:使本机系统不使用即将返回的IP数据包的源地址来作为ARP请求报文的源地址,而采用发送接口(物理网卡)的IP作为ARP请求报文源地址。

搭建部署DR模式下的LVS集群

DR模式 LVS负载均衡群集部署
DR 服务器:192.168.142.10
Web 服务器1:192.168.142.20
Web 服务器2:192.168.142.30
vip:192.168.142.111
客户端:192.168.142.222
NFS 服务器:192.168.142.40

1.配置负载调度器(192.168.80.10)

systemctl stop firewalld.service
setenforce 0
modprobe ip_vs
cat /proc/net/ip_vs
yum -y install ipvsadm

1. 配置虚拟 IP 地址(VIP:192.168.142.111)
cd /etc/sysconfig/network-scripts/
cp ifcfg-ens33 ifcfg-ens33:0               #若隧道模式,复制为ifcfg-tunl0
vim ifcfg-ens33:0
DEVICE=ens33:0
ONBOOT=yes
IPADDR=192.168.142.111
NETMASK=255.255.255.255

ifup ens33:0
ifconfig ens33:0

2. 调整 proc 响应参数
#由于 LVS 负载调度器和各节点需要共用 VIP 地址,需要关闭 icmp 的重定向,不充当路由器。
vim /etc/sysctl.conf
net.ipv4.ip_forward = 0
net.ipv4.conf.all.send_redirects = 0
net.ipv4.conf.default.send_redirects = 0
net.ipv4.conf.ens33.send_redirects = 0

sysctl -p

3. 配置负载分配策略
ipvsadm-save > /etc/sysconfig/ipvsadm
systemctl start ipvsadm

ipvsadm -C
ipvsadm -A -t 192.168.142.111:80 -s rr
ipvsadm -a -t 192.168.142.111:80 -r 192.168.142.20:80 -g            #若隧道模式,-g替换为-i
ipvsadm -a -t 192.168.142.111:80 -r 192.168.142.30:80 -g
ipvsadm

ipvsadm -ln					#查看节点状态,Route代表 DR模式

Snipaste_2022-10-16_17-57-11.png

Snipaste_2022-10-16_17-58-19.png Snipaste_2022-10-16_18-01-21.png

2.部署共享存储(NFS服务器:192.168.142.40)

systemctl stop firewalld.service
setenforce 0

yum -y install nfs-utils rpcbind
mkdir /opt/abc /opt/cba
chmod 777 /opt/abc /opt/cba

vim /etc/exports
/usr/share *(ro,sync)
/opt/abc 192.168.142.0/24(rw,sync)
/opt/cba 192.168.142.0/24(rw,sync)

systemctl start rpcbind.service
systemctl start nfs.service

Snipaste_2022-10-16_18-04-24.png

3.配置节点服务器(192.168.142.20、192.168.142.30)

systemctl stop firewalld.service
setenforce 0

1. 配置虚拟 IP 地址(VIP:192.168.142.111)
#此地址仅用作发送 Web响应数据包的源地址,并不需要监听客户机的访问请求(改由调度器监听并分发)。因此使用虚接口 lo∶0 来承载 VIP 地址,并为本机添加一条路由记录,将访问 VIP 的数据限制在本地,以避免通信紊乱。
cd /etc/sysconfig/network-scripts/
cp ifcfg-lo ifcfg-lo:0		
vim ifcfg-lo:0
DEVICE=lo:0
ONBOOT=yes
IPADDR=192.168.142.111
NETMASK=255.255.255.255			#注意:子网掩码必须全为 1

ifup lo:0
ifconfig lo:0
route add -host 192.168.142.111 dev lo:0

vim /etc/rc.local
/sbin/route add -host 192.168.142.111 dev lo:0
chmod +x /etc/rc.d/rc.local

2. 调整内核的 ARP 响应参数以阻止更新 VIP 的 MAC 地址,避免发生冲突
vim /etc/sysctl.conf
......
net.ipv4.conf.lo.arp_ignore = 1	    #系统只响应目的IP为本地IP的ARP请求
net.ipv4.conf.lo.arp_announce = 2    #系统不使用IP包的源地址来设置ARP请求的源地址,而选择发送接口的IP地址
net.ipv4.conf.all.arp_ignore = 1
net.ipv4.conf.all.arp_announce = 2

sysctl -p
或者
echo "1" >/proc/sys/net/ipv4/conf/lo/arp_ignore
echo "2" >/proc/sys/net/ipv4/conf/lo/arp_announce
echo "1" >/proc/sys/net/ipv4/conf/all/arp_ignore
echo "2" >/proc/sys/net/ipv4/conf/all/arp_announce
sysctl -p

yum -y install nfs-utils rpcbind httpd
systemctl start rpcbind
systemctl start httpd

#添加web1:192.168.142.20 NFS服务 
mount.nfs 192.168.142.40:/opt/abc /var/www/html
echo 'this is abc web!' > /var/www/html/index.html

#添加web2:192.168.142.30 NFS服务
mount.nfs 192.168.142.40:/opt/cba /var/www/html
echo 'this is cba web!' > /var/www/html/index.html

Snipaste_2022-10-16_18-11-11.png

Snipaste_2022-10-16_18-15-31.png

Snipaste_2022-10-16_18-19-43.png

Snipaste_2022-10-16_18-21-54.png

Snipaste_2022-10-16_18-22-34.png

4.测试 LVS 群集

在客户端使用浏览器访问 http://192.168.142.111/

Snipaste_2022-10-16_18-24-55.png Snipaste_2022-10-16_18-25-26.png

搭建DR模式所遇问题

1. 为什么所有RS上都要配置VIP

因为当调度器把请求转发给对应RS时,并没有修改报文目的IP,因此请求报文目的IP仍为VIP,所以如果RS没有配置VIP,那么报文到达RS后就会被丢弃。

2. 为什么所有RS要设置arp_ignore=1和arp_announce=2

arp_ignore=1:只响应目的IP地址为接收网卡上的本地地址的arp请求

因为我们在RS上都配置了VIP,因此此时是存在IP冲突的,当外部客户端向VIP发起请求时,会先发送arp请求,此时调度器和RS都会响应这个请求。如果某个RS响应了这个请求,则之后该客户端的请求就都发往该RS,并没有经过LVS,因此也就没有真正的负载均衡,LVS也就没有存在的意义。因此我们需要设置RS不响应对VIP的arp请求,这样外部客户端的所有对VIP的arp请求才会都解析到调度器上,然后经由LVS的调度器发往各个RS。

系统默认arp_ignore=0,表示响应任意网卡上接收到的对本机IP地址的arp请求(包括环回网卡上的地址),而不管该目的IP是否在接收网卡上。也就是说,如果机器上有两个网卡设备A和B,即使在A网卡上收到对B IP的arp请求,也会回应。而arp_ignore设置成1,则不会对B IP的arp请求进行回应。由于lo肯定不会对外通信,所以如果只有一个对外网口,其实只要设置这个对外网口即可,不过为了保险,很多时候都对all也进行设置。

arp_announce=2:网卡在发送arp请求时使用出口网卡IP作为源IP

当RS处理完请求,想要将响应发回给客户端,此时想要获取目的IP对应的目的MAC地址,那么就要发送arp请求。arp请求的目的IP就是想要获取MAC地址的IP,那arp请求的源IP呢?自然而然想到的是响应报文的源IP地址,但也不是一定是这样,arp请求的源IP是可以选择的,而arp_announce的作用正是控制这个地址如何选择。系统默认arp_announce=0,也就是源ip可以随意选择。这就会导致一个问题,如果发送arp请求时使用的是其他网口的IP,达到网络后,其他机器接收到这个请求就会更新这个IP的mac地址,而实际上并不该更新,因此为了避免arp表的混乱,我们需要将arp请求的源ip限制为出口网卡ip,因此需要设置arp_announce=2。

3. 为什么RS上的VIP要配置在lo上

由上可知,只要RS上的VIP不响应arp请求就可以了,因此不一定要配置在lo上,也可以配置在其他网口。由于lo设备不会直接接收外部请求,因此只要设置机器上的出口网卡不响应非本网卡上的arp请求接口。但是如果VIP配置在其他网口上,除了上面的配置,还需要配置该网口不响应任何arp请求,也就是arp_ignore要设置为8。

4. 为什么RS上lo配置的VIP掩码为32位

这是由于lo设备的特殊性导致, 如果lo绑定192.168.0.200/24,则该设备会响应该网段所有IP(192.168.0.1~192.168.0.254) 的请求,而不是只响应192.168.0.200这一个地址。

5. 为什么调度器与RS要在同一网段中

根据DR模式的原理,调度器只修改请求报文的目的mac,也就是转发是在二层进行,因此调度器和RS需要在同一个网段,从而ip_forward也不需要开启。