一、Haproxy简介
1.1、常见的web集群调度器
目前常见的Web集群调度器分为软件和硬件
- 软件:
通常使用开源的LVS、Haproxy、Nginx - 硬件:
一般使用比较多的是F5,也有很多人使用国内的一些产品,如梭子鱼、绿盟(裸金属)等
1.2、Haproxy的应用
-
Haproxy是一款可提供高可用性、 负载均衡、及基于TCP和HTTP应用的代理的软件
- 适用于负载大的Web站点
- 运行在硬件上可支持数以万计的并发连接的连接请求
1.3、Haproxy的优点
1.4、Haproxy调度算法原理
Haproxy支持多种调度算法,最常用的有三种
- RR (Round Robin):轮询调度
- 举例:有2个节点a、b
- 第一个用户访问会被指派的节点是a
- 第二个用户访问会被指派的节点是b
- 第三个用户访问会被指派的节点是a
- 循环往复
- 举例:有2个节点a、b
- LC (Least|Connections):最小连接数算法,根据后端的节点连接数大小动态分配前端请求
- 举例:有三个节点a、b、c,连接数分别为1、2、3
- 第一个用户连接请求时,会被指派到a上,连接数变为2、2、3
- 第二个用户请求会继续分配给a,连接数变为3、2、3
- 第三个用户连接请求时,会分配给b
- 以此类推
- 举例:有三个节点a、b、c,连接数分别为1、2、3
- SH (Source Hashing):基于来源访问调度算法,用于一些有Session会话记录在服务器端的场景,可以基于来源的IP、Cookie等做集群调度
- 举例:有三个节点a、b、c
- 第一个用户第一次访问被指派到了a,第二个用户第一次访问被指派到了b
- 第一个用户第二次访问会被继续指派到a,第二个用户第二次访问时依旧会被指派到b
- 只要负载均衡调度器不重启,第一个用户访问都会被指派到a,第二个用户访问都会被指派到b,永远轮不到c
- 举例:有三个节点a、b、c
1.5、nginx、LVS、Haproxy的区别
- nginx
- 支持正则
- 只支持基于端C1的健康检查
- 不支持session的直接保持,但能通过IP_ hash来解决
- 对网络稳定性要求不高
- 反向代理能力强
- nginx社区活跃( 社区:维护、更新服务的组织)、收费社区
- LVS
- 只能基于四层端口转发
- 在四层做分发作用,抗负载能力强
- 应用范围广(几乎可以对所有应用做负载)
- Haproxy .
- 支持8种负载均衡策略
- 仅做负载均衡软件使用,在高并发情况下性能优于nginx
- 支持URL健康检测、支持session保持
二、搭建Haproxy代理服务器
2.1、实验环境
| 角色 | ip |
|---|---|
| Haproxy | 192.168.35.40 |
| web1 | 192.168.35.10 |
| web2 | 192.168.35.20 |
| wind10 | 192.168.10.100 |
2.2、安装Haproxy
cd /opt
haproxy-1.5.19.tar.gz ##上传压缩包
yum install -y pcre-devel bzip2-devel gcc gcc-c++ make ##安装依赖环境
tar zxvf haproxy-1.5.19.tar.gz ##解压
cd haproxy-1.5.19/
make TARGET=linux2628 ARCH=x86_64
make install
参数说明:
- TARGET=linux2628 ##内核版本
- 使用uname -r 查看内核,如2.6.18-371.e15,此时该参数用TARGET=linux26;kernel大于2.6.28的用TARGET=linux2628
- ARCH=x86_64 ##系统位数,64位系统
2.3、Haproxy服务器配置【配置文件解析】
mkdir /etc/haproxy
cp examples/haproxy.cfg /etc/haproxy/
cd /etc/haproxy/
vim haproxy.cfg
3 global
--------------->4~5行–修改,配置日志记录,local0为日志设备,默认存放到系统日志<----------------------
4 log /dev/log local0 info
5 log /dev/log local0 notice
6 #log loghost local0 info
7 maxconn 4096 #最大连接数,需考虑ulimit -n限制
--------------->8行–注释,chroot(改变根目录),为该服务自设置的根目录,一般需将此行注释掉<----------------------
8 #chroot /usr/share/haproxy ##注释掉
9 uid 99 #用户UID
10 gid 99 #用户GID
11 daemon #守护进程模式
15 defaults
16 log global #定义日志为global配置中的日志定义
17 mode http #模式为http
18 option httplog #采用http日志格式记录日志
19 option dontlognull #不记录健康检查日志信息
20 retries 3 #检查节点服务器失败次数,连续达到三次失败,则认为节点不可用
21 redispatch #当服务器负载很高时,自动结束当前队列处理比较久的连接
22 maxconn 2000 #最大连接数
23 contimeout 5000 #连接超时时间
24 clitimeout 50000 #客户端超时时间
25 srvtimeout 50000 #服务器超时时间
--------------->27行之后全部删除,复制以下内容<----------------------
27 listen webcluster 0.0.0.0:80 监听web服务集群
28 option httpchk GET /test.html #检查服务器的test.html文件
29 balance roundrobin #负载均衡调度算法使用轮询算法roundrobin
30 server inst1 192.168.35.10:80 check inter 2000 fall 3 #定义在线节点
31 server inst2 192.168.35.20:80 check inter 2000 fall 3
参数详解:
- balance roundrobin #负载均衡调度算法
- 轮询算法:roundrobin
- 最小连接数算法:leastconn
- 来源访问调度算法:source hashing,类似于nginx的ip_hash
- check inter 2000 #表示haproxy服务器和节点之间的一个心跳频率
- fall 3 #表示连续三次检测不到心跳频率则认为该节点失效
- 若节点配置后带有“backup”表示该节点只是个备份节点,只有主节点失效该节点才会上。不携带“backup”,表示为主节点,和其它主节点共同提供服务
2.4、2台web服务器安装httpd服务
192.168.35.10:
echo "this is ddd web" > /usr/local/nginx/html/test.html
192.168.35.20:
echo "this is www web" > /usr/local/nginx/html/test.html
2.5、启动Haproxy服务
cp /opt/haproxy-1.5.19/examples/haproxy.init /etc/init.d/haproxy
cd /etc/init.d/
chmod +x haproxy
chkconfig --add /etc/init.d/haproxy
ln -s /usr/local/sbin/haproxy /usr/sbin/haproxy
service haproxy start
2.6、测试win端192.168.35.40/test.html
web1:
web2:
三、Haproxy 日志管理
- 修改Haproxy配置文件中关于日志配置的选项,加入配置
- log /dev/1oq loac10 info
- log /dev/ log 1oca10 notice
- 修改rsyslog配置,将haproxy相关配置独立定义到haproxy.conf, 并放到/etc/rsyslog.d/下
- 保存配置文件并重启rsyslog服务,完成rsyslog配置
四、Haproxy参数优化
随着企业网站负载增加,haproxy参数优化相当重要,具体的优化项如下:
- maxconn: 最大连接数,根据应用实际情况进行调整,推荐使用10 240
- daemon: 守护进程模式;Haproxy可以使用非守护进程模式启动,建议使用守护进程模式启动
- nbproc:负载均衡的并发进程数,建议与当前服务器CPU核数相等或为其2倍
- retries: 重试次数,主要用于对集群节点的检查,如果节点多,且并发量大,设置为2次或3次
- option http-server-close: 主动关闭http请求选项, 建议在生产环境中使用此选项
- timeouthttp-keep-alive:长连接超时时间,设置长连接超时时间,可以设置为10s
- Limeoul http-requesL: hLLp请求超时时问,建议将此时问设置为5-~10s, 增加http连接释放速度
- timcout. clicnt: 客户端超时时间,如果访问量过大,节点响应慢,可以将此时间设置短一 些,建议设置为1min左右就可以了