Nginx学习之负载均衡(6)

139 阅读10分钟

Nginx学习之负载均衡(6)

本笔记是参考《黑马程序员Nginx教程》总结,供学习查阅

1.背景

随着互联网的发展,业务流量越来越大并且业务逻辑也跟着越来越复杂,单台服务器的性能及单点故障问题就凸显出来了

因此需要多台服务器进行性能的水平扩展及避免单点故障出现

系统的扩展可以分为纵向扩展和横向扩展

纵向扩展是从单机的角度出发,通过增加系统的硬件处理能力来提升服务器的处理能力

横向扩展是通过添加机器来满足大型网站服务的处理能力

2.负载均衡的作用

1、解决服务器的高并发压力,提高应用程序的处理性能。

2、提供故障转移,实现高可用。

3、通过添加或减少服务器数量,增强网站的可扩展性。

4、在负载均衡器上进行过滤,可以提高系统的安全性。

3.负载均衡常用的处理方式

方式一用户手动选择

是在网站主页上面提供不同线路、不同服务器链接方式,让用户来选择自己访问的具体服务器

方式二:DNS轮询方式

大多域名注册商都支持对同一个主机名添加多条A记录,这就是DNS轮询,DNS服务器将解析请求按照A记录的顺序,随机分配到不同的IP上,这样就能完成简单的负载均衡。DNS轮询的成本非常低,在一些不重要的服务器,被经常使用。

域名系统(服务)协议(DNS)是一种分布式网络目录服务,主要用于域名与 IP 地址的相互转换。

但是DNS负载均衡存在明显的缺点:1.可靠性低 2.负载不均衡

方式三:四/七层负载均衡

OSI(open systeminterconnection),叫开放式系统互联模型,这个是由国际标准化组织ISO指定的一个不基于具体机型、操作系统或公司的网络体系结构。该模型将网络通信的工作分为七层。

image-20221028145002584

所谓四层负载均衡指的是OSI七层模型中的传输层,主要是基于IP+PORT的负载均衡

实现四层负载均衡的方式:
硬件:F5 BIG-IP、Radware等
软件:LVS、Nginx、Hayproxy等

所谓的七层负载均衡指的是在应用层,主要是基于虚拟的URL或主机IP的负载均衡

实现七层负载均衡的方式:
软件:Nginx、Hayproxy等

四层和七层负载均衡的区别

四层负载均衡数据包是在底层就进行了分发,而七层负载均衡数据包则在
最顶端进行分发,所以四层负载均衡的效率比七层负载均衡的要高。
四层负载均衡不识别域名,而七层负载均衡识别域名。

4.Nginx七层负载均衡

Nginx要实现七层负载均衡需要用到proxy_pass代理模块配置。Nginx默认安装支持这个模块

Nginx的负载均衡是在Nginx的反向代理基础上把用户的请求根据指定的算法分发到一组【upstream虚拟服务池】。

4.1 负载均衡常用指令

4.1.1upstream指令

该指令是用来定义一组服务器,它们可以是监听不同端口的服务器,并且也可以是同时监听TCP和Unix socket的服务器。服务器可以指定不同的权重,默认为1。

语法upstream name {...}
默认值
位置http

4.1.2 server指令

该指令用来指定后端服务器的名称和一些参数,可以使用域名、IP、端口或者unix socket

语法server name [paramerters]
默认值
位置upstream

4.2 Nginx七层负载均衡的实现流程

image-20221028145637077

准备三台服务器,配置如下:

server {
    listen 9001;
    server_name localhost;
    default_type text/html;
    location /{
    return 200 '<h1>192.168.200.146:9001</h1>';
    }
} 
server {
    listen 9002;
    server_name localhost;
    default_type text/html;
    location /{
    return 200 '<h1>192.168.200.146:9002</h1>';
    }
} 
server {
    listen 9003;
    server_name localhost;
    default_type text/html;
    location /{
    return 200 '<h1>192.168.200.146:9003</h1>';
    }
}

负载均衡器设置

upstream backend{
    server 192.168.200.146:9091;
    server 192.168.200.146:9092;
    server 192.168.200.146:9093;
} 
server {
    listen 8083;
    server_name localhost;
    location /{
    proxy_pass http://backend;
    }
}

4.3 负载均衡状态

代理服务器在负责均衡调度中的状态有以下几个:

状态概述
down当前的server暂时不参与负载均衡
backup预留的备份服务器
max_fails允许请求失败的次数
fail_timeout经过max_fails失败后, 服务暂停时间
max_conns限制最大的接收连接数

4.3.1 down

将该服务器标记为永久不可用,那么该代理服务器将不参与负载均衡。 该状态一般会对需要停机维护的服务器进行设置。

upstream backend{
    server 192.168.200.146:9001 down;
    server 192.168.200.146:9002
    server 192.168.200.146:9003;
}

4.3.2 backup

将该服务器标记为备份服务器,当主服务器不可用时,将用来传递请求。 可以使用firewall-cmd工具关闭linux某个端口来测试

upstream backend{
    server 192.168.200.146:9001 down;
    server 192.168.200.146:9002 backup;
    server 192.168.200.146:9003;
}

4.3.3 max_conns

max_conns=number:用来设置代理服务器同时活动链接的最大数量,默认为0,表示不限制,使用该配置可以根据后端服务器处理请求的并发量来进行设置,防止后端服务器被压垮。

4.3.4 max_fails和fail_timeout

max_fails=number:设置允许请求代理服务器失败的次数,默认为1。 fail_timeout=time:设置经过max_fails失败后,服务暂停的时间,默认是10秒。

upstream backend{
    server 192.168.200.133:9001 down;
    server 192.168.200.133:9002 backup;
    server 192.168.200.133:9003 max_fails=3 fail_timeout=15;
}

5.负载均衡策略

Nginx的upstream支持如下六种方式的分配算法,分别是:

算法名称说明
轮询默认方式
weight权重方式
ip_hash依据ip分配方式
least_conn依据最少连接方式
url_hash依据URL分配方式
fair依据响应时间方式

5.1 策略

5.1.1 轮询

是upstream模块负载均衡默认的策略。它不需要配置额外参数。假设配置文件中共有 M 台服务器,该算法遍历服务器节点列表,并按节点次序每轮选择一台服务器处理请求。当所有节点均被调用过一次后,该算法将从第一个节点开始重新一轮遍历。

upstream backend{
    server 192.168.200.146:9001;
    server 192.168.200.146:9002;
    server 192.168.200.146:9003;
}

5.1.2 weight加权[加权轮询]

weight=number:用来设置服务器的权重,默认为1,权重数据越大,被分配到请求的几率越大;该权重值,主要是针对实际工作环境中不同的后端服务器硬件配置进行调整的,所有此策略比较适合服务器的硬件配置差别比较大的情况。

upstream backend{
    server 192.168.200.146:9001 weight=10;
    server 192.168.200.146:9002 weight=5;
    server 192.168.200.146:9003 weight=3;
}

5.1.3 ip_hash

当对后端的多台动态应用服务器做负载均衡时,ip_hash指令能够将某个客户端IP的请求通过哈希算法定位到同一台后端服务器上。这样,当来自某一个IP的用户在后端Web服务器A上登录后,在访问该站点的其他URL,能保证其访问的还是后端web服务器A。 如下图所示:用户访问服务器的时候,就不用担心负载均衡每次选择不同的服务器而导致用户反复登录,因为每次根据IP进入同一台服务器,那么里面的session就是同一个

image-20221028151614887

语法ip_hash;
默认值
位置upstream
upstream backend{
    ip_hash;
    server 192.168.200.146:9001;
    server 192.168.200.146:9002;
    server 192.168.200.146:9003;
}

注意:使用ip_hash指令无法保证后端服务器的负载均衡,可能导致有些后端服务器接收到的请求多,有些后端服务器接收的请求少,而且设置后端服务器权重等方法将不起作用。

5.1.4 least_conn

最少连接,把请求转发给连接数较少的后端服务器。轮询算法是把请求平均的转发给各个后端,使它们的负载大致相同;但是,有些请求占用的时间很长,会导致其所在的后端负载较高。这种情况下,least_conn这种方式就可以达到更好的负载均衡效果。如下图,web1的处理时间比较长,那么请求堆积就比较多,所以后续请求应该更多的发送给web3

image-20221028151911883

upstream backend{
    least_conn;
    server 192.168.200.146:9001;
    server 192.168.200.146:9002;
    server 192.168.200.146:9003;
}

此负载均衡策略适合请求处理时间长短不一造成服务器过载的情况。

5.1.5 url_hash

按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,要配合缓存命中来使用。同一个资源多次请求,可能会到达不同的服务器上,导致不必要的多次下载,缓存命中率不高,以及一些资源时间的浪费。而使用url_hash,可以使得同一个url(也就是同一个资源请 求)会到达同一台服务器,一旦缓存住了资源,再此收到请求,就可以从缓存中读取。

image-20221028152126031

如上图,当请求某个资源时,若每次服务器都不一样,那么每次都会把资源重复拷贝到每个服务器上,实际上是造成了资源浪费

upstream backend{
    hash &request_uri;
    server 192.168.200.146:9001;
    server 192.168.200.146:9002;
    server 192.168.200.146:9003;
}

5.1.6 fair

fair采用的不是内建负载均衡使用的轮换的均衡算法,而是可以根据页面大小、加载时间长短智能的进行负载均衡。那么如何使用第三方模块的fair负载均衡策略。

upstream backend{
    fair;
    server 192.168.200.146:9001;
    server 192.168.200.146:9002;
    server 192.168.200.146:9003;
}

因为fair属于第三方模块实现的负载均衡。需要添加nginx-upstream-fair

5.2 案例

5.2.1 对特定资源实现负载均衡

输入不同url,可以访问不同的资源

upstream videobackend{
    server 192.168.200.146:9001;
    server 192.168.200.146:9002;
} 
upstream filebackend{
    server 192.168.200.146:9003;
    server 192.168.200.146:9004;
} 
server {
    listen 8084;
    server_name localhost;
    location /video/ {
    proxy_pass http://videobackend;
    } 
    location /file/ {
        proxy_pass http://filebackend;
    }
}

5.2.2 对不同域名实现负载均衡

输入不同的域名,可以访问不同的资源

upstream itcastbackend{
    server 192.168.200.146:9001;
    server 192.168.200.146:9002;
} 
upstream itheimabackend{
    server 192.168.200.146:9003;
    server 192.168.200.146:9004;
} 
server {
    listen 8085;
    server_name www.itcast.cn;
    location / {
    proxy_pass http://itcastbackend;
    }
} 
server {
    listen 8086;
    server_name www.itheima.cn;
    location / {
    proxy_pass http://itheimabackend;
    }
}

6.Nginx四层负载均衡

Nginx在1.9之后,增加了一个stream模块,用来实现四层协议的转发、代理、负载均衡等。stream模块的用法跟http的用法类似,允许我们配置一组TCP或者UDP等协议的监听,然后通过proxy_pass来转发我们的请求,通过upstream添加多个后端服务,实现负载均衡。

四层协议负载均衡的实现,一般都会用到LVS、HAProxy、F5等,要么很贵要么配置很麻烦,而Nginx的配置相对来说更简单,更能快速完成工作。

6.1 添加stream模块的支持

Nginx默认是没有编译这个模块的,需要使用到stream模块,那么需要在编译的时候加上--withstream

》将原有/usr/local/nginx/sbin/nginx进行备份
》拷贝nginx之前的配置信息
》在nginx的安装源码进行配置指定对应模块 ./configure --
with-stream
》通过make模板进行编译
》将objs下面的nginx移动到/usr/local/nginx/sbin下
》在源码目录下执行 make upgrade进行升级,这个可以实现不停机添
加新模块的功能

6.2 四层负载均衡的指令

6.2.1 stream指令

该指令提供在其中指定流服务器指令的配置文件上下文。和http指令同级。

语法stream { ... }
默认值
位置main

6.2.2 upstream指令

该指令和http的upstream指令是类似的

6.3 案例

如下图,用户输入端口81,则负载均衡地访问redis,输入82,则访问tomcat

image-20221028154027635

nginx.conf配置

stream {
    upstream redisbackend {
        server 192.168.200.146:6379;
        server 192.168.200.146:6378;
    } 
    upstream tomcatbackend {
        server 192.168.200.146:8080;
    } 
    server {
        listen 81;
        proxy_pass redisbackend;
    } 
    server {
        listen 82;
        proxy_pass tomcatbackend;
    }
}

配置好后,我们可以输入一下命令重启

#检查
nginx -t 
#重新加载
nginx -s reload