nginx 学习笔记

122 阅读13分钟

一、基本概念

1 是什么

Nginx ("engine x") 是一个高性能的 HTTP 和 反向代理 服务器 、专为性能优化而开发

特点是占有内存少,处理高并发能力强

nginx 的并发能力确实在同类型的网页服务器中表现较好,能经受高负载的考验 ,有报告表明能支持高达 50,000 个并发连接数。

中国大陆使用 nginx 网站用户有:百度、京东、新浪、网易、腾讯、淘宝等

2 正向代理

Nginx 不仅可以做反向代理、附在均衡。还可以用作正向代理进行上网等功能。

正向代理:如果把局域网外的Internet 想象成一个巨大的资源库,

则局域网中的客户端要访问 Internet ,则需要通过代理服务器来访问,这种代理服务就称为正向代理。

需要在客户端配置代理服务器进行指定网站访问

image.png

3 反向代理

反向代理,其实客户端对代理是无感知的,因为客户端不需要任何配置就可以访问

我们只需要将请求发送到反向代理服务器,由反向代理服务器去选择目标服务器获取数据后,在返回给客户端

此时反向代理服务器和目标服务器对外就是一个服务器,暴露的是代理服务器地址,隐藏了真实服务器 IP 地址。

暴露的是代理服务器地址,隐藏了真实服务器 IP 地址。

image.png

4 负载均衡

客户端发送多个请求到服务器,服务器处理请求,有些可能要与数据库进行交互,服务器处理完毕后,再将结果返回给客户端。

这种架构模式对于早期的系统相对单一并发请求相对较少的情况下是比较适合的,成本也低。但是随着信息数量的不断增长,访问量和数据量的飞速增长,以及系统业务的复杂度增加,这种架构会造成服务器相应客户端的请求日益缓慢,并发量特别大的时候,还容易造成服务器直接崩溃。很明显这是由于服务器性能的瓶颈造成的问题,那么如何解决这种情况呢?

我们首先想到的可能是升级服务器的配置,比如提高CPU执行频率,加大内存等提高机器的物理性能来解决此问题,但是我们知道摩尔定律的日益失效,硬件的性能提升已经不能满足日益提升的需求了。最明显的一个例子,天猫双十一当天,某个热销商品的瞬时访问量是极其庞大的,那么类似上面的系统架构,将机器都增加到现有的顶级物理配置,都是不能够满足需求的。那么怎么办呢?

上面的分析我们去掉了增加服务器物理配置来解决问题的办法,也就是说纵向解决问题的办法行不通了,那么横向增加服务器的数量呢?这时候集群的概念产生了,单个服务器解决不了,我们增加服务器的数量,然后将请求分发到各个服务器上,将原先请求集中到单个服务器上的情况改为将请求分发到多个服务器上,将负载分发到不同的服务器,也就是我们所说的负载均衡

增加服务器的数量,然后将请求分发到各个服务器上,将原先请求集中到单个服务器上的情况改为将请求分发到多个服务器上,将负载分发到不同的服务器,也就是我们所说的负载均衡

5 动静分离

为了加快网站的解析速度,可以把动态页面和静态页面由不同的服务器来解析,加快解析速度。降低原来单个服务器的压力。

image.png


二、 nginx安装和常用命令、配置文件

1 linux系统中安装nginx

① 安装 pcre

wget http://downloads.sourceforge.net/project/pcre/pcre/8.37/pcre-8.37.tar.gz
tar -zxvf pcre-8.37.tar.gz
./configure
pcre 目录下执行 make && make install

② 安装 openssl

③ 安装 zlib

yum -y install make zlib zlib-devel gcc-c++ libtool openssl openssl-devel

④ 安装 nginx

1 解压缩 nginx xx.tar.gz 包。 2 进入解压缩目录 执行 ./configure 。 3 make && make install

# 查看开放的端口号
firewall-cmd list all
​
# 设置开放的端口号
firewall-cmd  --add-service=http-permanent
sudo firewall-cmd --add-port=80/tcp --permanent
​
# 重启防火墙
firewall-cmd  -reload

2 nginx常用命令

启动 ./nginx

关闭 ./nginx -s stop

重新加载 ./nginx -s reload

3 nginx配置文件

#user  nobody;
worker_processes  1;#error_log  logs/error.log;
#error_log  logs/error.log  notice;
#error_log  logs/error.log  info;#pid        logs/nginx.pid;
​
events {
    worker_connections  1024;
}
​
http {
    include       mime.types;
    default_type  application/octet-stream;
​
    #log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
    #                  '$status $body_bytes_sent "$http_referer" '
    #                  '"$http_user_agent" "$http_x_forwarded_for"';
​
    #access_log  logs/access.log  main;
​
    sendfile        on;
    #tcp_nopush     on;
​
    #keepalive_timeout  0;
    keepalive_timeout  65;
​
    #gzip  on;
​
    server {
        listen       80;
        server_name  localhost;
​
        #charset koi8-r;
​
        #access_log  logs/host.access.log  main;
​
        location / {
            root   html;
            index  index.html index.htm;
        }
​
        #error_page  404              /404.html;
​
        # redirect server error pages to the static page /50x.html
        #
        error_page   500 502 503 504  /50x.html;
        location = /50x.html {
            root   html;
        }
​
        # proxy the PHP scripts to Apache listening on 127.0.0.1:80
        #
        #location ~ .php$ {
        #    proxy_pass   http://127.0.0.1;
        #}
​
        # pass the PHP scripts to FastCGI server listening on 127.0.0.1:9000
        #
        #location ~ .php$ {
        #    root           html;
        #    fastcgi_pass   127.0.0.1:9000;
        #    fastcgi_index  index.php;
        #    fastcgi_param  SCRIPT_FILENAME  /scripts$fastcgi_script_name;
        #    include        fastcgi_params;
        #}
​
        # deny access to .htaccess files, if Apache's document root
        # concurs with nginx's one
        #
        #location ~ /.ht {
        #    deny  all;
        #}
    }
​
    # another virtual host using mix of IP-, name-, and port-based configuration
    #
    #server {
    #    listen       8000;
    #    listen       somename:8080;
    #    server_name  somename  alias  another.alias;
    #    location / {
    #        root   html;
    #        index  index.html index.htm;
    #    }
    #}
​
​
    # HTTPS server
    #
    # server {
    #    listen       443 ssl;
    #    server_name  localhost;
​
    #    ssl_certificate      cert.pem;
    #    ssl_certificate_key  cert.key;
​
    #    ssl_session_cache    shared:SSL:1m;
    #    ssl_session_timeout  5m;
​
    #    ssl_ciphers  HIGH:!aNULL:!MD5;
    #    ssl_prefer_server_ciphers  on;
​
    #    location / {
    #        root   html;
    #        index  index.html index.htm;
    #    }
    #}
}

根据上述文件,我们可以很明显的将 nginx.conf 配置文件分为三部分:

第一部分:全局块

从配置文件开始到 events 块之间的内容,主要会设置一些影响 nginx 服务器整体运行的配置指令,主要包括配置运行 Nginx 服务器的用户(组)、允许生成的 worker process 数,进程 PID 存放路径、日志存放路径和类型以及配置文件的引入等。

比如上面第一行配置的:

worker_processes  1;

这是 Nginx 服务器并发处理服务的关键配置,worker_processes 值越大,可以支持的并发处理量也越多,但是会受到硬件、软件等设备的制约.

第二部分:events块

比如上面的配置:

events {
    worker_connections  1024;
}

events 块涉及的指令主要影响 Nginx 服务器与用户的网络连接,常用的设置包括是否开启对多 work process 下的网络连接进行序列化,是否允许同时接收多个网络连接,选取哪种事件驱动模型来处理连接请求,每个 word process 可以同时支持的最大连接数等。

上述例子就表示每个 work process 支持的最大连接数为 1024.

这部分的配置对 Nginx 的性能影响较大,在实际中应该灵活配置。

第三部分:http块

http {
    include       mime.types;
    default_type  application/octet-stream;
​
    sendfile        on;
    #tcp_nopush     on;
​
    keepalive_timeout  65;
​
    #gzip  on;
​
    server {
        listen       80;
        server_name  localhost;
​
        location / {
            root   html;
            index  index.html index.htm;
        }
​
        #error_page  404              /404.html;
​
        error_page   500 502 503 504  /50x.html;
        location = /50x.html {
            root   html;
        }
    }
}

这算是 Nginx 服务器配置中最频繁的部分,代理、缓存和日志定义等绝大多数功能和第三方模块的配置都在这里。

需要注意的是:http 块也可以包括 http全局块、server 块。

① http 全局块

http全局块配置的指令包括文件引入、MIME-TYPE 定义、日志自定义、连接超时时间、单链接请求数上限等。

② server 块

这块和虚拟主机有密切关系,虚拟主机从用户角度看,和一台独立的硬件主机是完全一样的,该技术的产生是为了节省互联网服务器硬件成本。

每个 http 块可以包括多个 server 块,而每个 server 块就相当于一个虚拟主机。

而每个 server 块也分为全局 server 块,以及可以同时包含多个 locaton 块。

1. 全局 server 块 
 - 最常见的配置是本虚拟机主机的监听配置和本虚拟主机的名称或IP配置。
2. location 块 
 - 一个 server 块可以配置多个 location 块。 这块的主要作用是基于 Nginx 服务器接收到的请求字符串(例如 server_name/uri-string),对虚拟主机名称(也可以是IP别名)之外的字符串(例如 前面的 /uri-string)进行匹配,对特定的请求进行处理。地址定向、数据缓存和应答控制等功能,还有许多第三方模块的配置也在这里进行。

三、nginx配置实例

1 反向代理

实例一

① 实现效果

打开浏览器,在浏览器地址栏输入地址www.123.com 跳转到 linux 系统 tomcat 主页面中

② 准备工作

  1. 安装 nginx
  2. 安装 tomcat 服务器,使用默认端口 8080

③ 访问过程的解析

windows浏览器 --> nginx --> tomcat

④ 具体配置

  1. 在 w indows 系统的 host 文件进行域名和 ip 对应关系的配置
    • 添加配置:
  2. 在 nginx 进行请求转发的配置(反向代理配置)
    server {
        listen      80;
        server_name 139.198.176.132;
        
        location / {
            root        html;
            proxy_pass  http://127.0.0.1:8080;
            index       inmdex.html index.htm;
        }
    }
    

实例二

① 实现效果

使用 nginx 反向代理,根据访问的路径跳转到不同端口的服务中 nginx 监听端口为 9001

访问 http:// 192.168.17.129 :9001/edu/ 直接跳转到 127.0.0.1:808 0 访问 http:// 192.168.17.129 :9001/vod/ 直接跳转到 127.0.0.1:808 1

② 准备工作

  1. 准备两个 tomcat 服务器,一个 8080 端口,一个 8081 端口
  2. 创建文件夹和测试页面

③ 具体配置

找到 nginx 配置文件,进行反向代理配置

```
server {
    listen       9009;
    server_name  139.198.176.132;
    location ~ /edu/ {
        proxy_pass http://127.0.0.1:8080;
    }
​
    location ~ /vod/ {
        proxy_pass http://127.0.0.1:8081;
    }
}
```
  1. = :用于不含正则表达式的 uri 前,要求请求字符串与 uri 严格匹配,如果匹配成功,就停止继续向下搜索并立即处理该请求。
  2. ~:用于表示 uri 包含正则表达式,并且区分大小写。
  3. ~*:用于表示 uri 包含正则表达式,并且不区分大小写。
  4. ^~:用于不含正则表达式的 uri 前,要求 Nginx 服务器找到标识 uri 和请求字符串匹配度最高的 location 后,立即使用此 location 处理请求,而不再使用 location 块中的正则 uri 和请求字符串做匹配。 注意:如果 uri 包含正则表达式,则必须要有 ~ 或者 ~* 标识。

2 负载均衡

① 实现效果

浏览器地址栏输入地址:http://www.zheteng.com:9009/edu/a.html,附在均衡效果,平均 8080 和 8081

② 准备工作

  1. 准备两台 tomcat 服务器,一台8080,一台8081

  2. 在两台 tomcat 里面 webapps 目录中,创建名称是 edu 文件夹,在 edu 文件夹中创建页面 a.html ,用于测试

  3. 在 nginx 的配置文件中进行负载均衡的配置

    upstream myserver {
        server 139.198.176.132:8080;
        server 139.198.176.132:8081;
    }
    ​
    server server {
        listen       80;
        server_name  139.198.176.132;
            location / {
            proxy_pass http://myserver;
        }
    }
    
  4. nginx 分配服务器策略

    1. 轮询(默认)
      • 每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器 down 掉,能自动剔除。
    2. weight
      • weight 代表权重,默认为 1, 权重越高被分配的客户端越多
    3. ip_hash 每个请求按访问 ip 的 hash 结果分配,这样每个访客固定访问一个后端服务器
    4. fair (第三方) 按后端服务器的响应时间来分配请求,响应时间短的优先分配。

3 动静分离

① 什么是动静分离

Nginx 动静分离简单来说就是把动态跟静态请求分开,不能理解成只是单纯的把动态页面和静态页面物理分离。严格意义上说应该是动态请求跟静态请求分开,可以理解成使用Nginx 处理静态页面,Tomcat处理动态页面。

动静分离从目前实现角度来讲大致分为两种, 一种是纯粹把静态文件独立成单独的域名,放在独立的服务器上,也是目前主流推崇的方案; 另外一种方法就是动态跟静态文件混合在一起发布,通过 nginx 来分开。

通过 location 指定不同的后缀名实现不同的请求转发。通过 expires 参数设置,可以使浏览器缓存过期时间,减少与服务器之前的请求和流量。具体 Expires 定义:是给一个资源设定一个过期时间,也就是说无需去服务端验证,直接通过浏览器自身确认是否过期即可,所以不会产生额外的流量。此种方法非常适合不经常变动的资源。(如果经常更新的文件,不建议使用 Expires 来缓存),我这里设置 3d,表示在这 3 天之内访问这个 URL,发送一个请求,比对服务器该文件最后更新时间没有变化,则不会从服务器抓取,返回状态码 304,如果有修改,则直接从服务器重新下载,返回状态码 200。

② 准备工作

  1. 在linux系统中准备静态资源,用于进行访问

③ 具体配置

在 nginx 配置文件中进行配置

```
server {
    listen       80;
    server_name  139.198.176.132;
    
    location /www/  {
        root            /data/;
        index           index.html index.htm;
    }
​
    location /image/ {
        root            /data/;
        autoindex       on;
    }
}
```

autoindex:返回资源列表

4 nginx配置高可用集群

① 什么是高可用集群

配置tomcat服务器的时候,我们有可能遇到宕机的效果,我们采用配置 nginx 负载均衡来解决。

那么,nginx 如果宕机了,单机情况下我们没办法,所以可以配置高可用集群,进行转发。

5nodvw.png

② 准备工作

1 需要两台 nginx 服务器 2 需要 keepalived (确定 nginx 存活状态) 3 需要虚拟 IP

③ 具体配置

  1. 修改 keepalived.conf 文件(yum安装则在/etc/keepalived/keepalived.conf)

    # 全局配置
    global_defs {
        notification_email {
            acassen@firewall.loc
            failover@firewall.loc
            sysadmin@firewall.loc
        }
        
        notification_email_from Alexandre.Cassen@firewall.loc
        smtp_server 1 92.168.17.129
        smtp_connect_timeout 30
        router_id LVS_DEVEL # 服务器名(在host文件中添加或查看)
    }
    ​
    # 检测脚本,脚本成立则执行
    vrrp_script chk_http_port {
        script "/usr/local/src/nginx_check.sh"
        interval 2  # 检测脚本执行的间隔
        weight 2    # 权重
    }
    ​
    vrrp_instance VI_1 {
        state BACKUP            # 备份服务器上将 MASTER 改为 BACKUP
        interface ens33         # 网卡
        virtual_router_id 51    # 主、备机的 virtual_router_id 必须相同
        priority 90             # 主、备机取不同的优先级,主机值较大,备份机值较小
        advert_int 1            # 心跳检测时间间隔,默认1秒
        
        # 权限校验的方式
        authentication { 
            auth_type PASS
            auth_pass 1111
        }
    ​
        # 虚拟 IP 可以绑定多个
        virtual_ipaddress { 
            192.168.17.50   # VRRP H虚拟地址虚拟地址 
        }
    }
    
  2. /usr/local/src 添加检测脚本

    #!/bin/bash
    A=`ps C nginx no header |wc l`
    if [ $A eq 0 ];then
        /usr/local/nginx/sbin/nginx         # 执行 nginx 的路径
        sleep 2
        if [ `ps C nginx no header |wc l` eq 0 ];then
            killall keepalived              # 结束 nginx 进程
        fi
    fi
    
  3. 启动 nginx 和 keepalived

    • nginx: ./nginx
    • keepalived:systemctl start keepalived.service

四、nginx原理

1 master & worker 机制

ljrpw1.png

nginx 有两种进程:master 和 worker

2 worker 如何工作 (worker争抢机制)

image.png

3 一个 master 多个 worker 好处

  1. 可以使用 nginx -s reload 热部署
  2. 每个worker是独立的进程,如果有其中的一个worker出问题,其他 worker 独立,继续进行争抢,实现请求,不会造成服务中断

4 设置多少 worker 合适

Nginx 和 redis 类似,采用 IO 多路复用机制(Windows无法实现,这也是为什么 linux 性能好),每个worker是一个独立的进程,但每个进程里只有一个主线程,通过异步非阻塞处理请求,每个线程可以最大程度发挥 CPU 的效能,所以 worker 数和服务器的 CPU 数相等是最合适

5 worker连接数

① 链接数

问:发送一个请求,worker 维持了几个?

答:2个或4个

  • 静态资源访问 2 个:Client --> worker worker --> Client
  • 动态资源访问 4 个:Client --> worker worker --> Tomcat Tomcat --> worker worker --> Client

② 最大并发数

问:nginx 有一个 master, 有四个 worker,每个 worker 支持最大的连接数为 1024,

答:

  • 静态资源访问:最大连接数 * worker进程数 / 2
  • 动态资源访问 / 反向代理:最大连接数 * worker进程数 / 4