Nginx综合介绍以及配置文件详解

1,219 阅读11分钟

Nginx介绍(事件驱动框架和异步处理)

Nginx是一款自由的、开源的、高性能的HTTP服务器和反向代理服务器;同时也是一个IMAP、POP3、SMTP代理服务器;Nginx可以作为一个HTTP服务器进行网站的发布处理,另外Nginx可以作为反向代理进行负载均衡的实现。Nginx具有高性能、高并发和低内存占用的特点,成为最主流的反向代理服务器。

  1. Nginx有一个主线程(Master process)和几个工作线程(Worker process),主线程主要是加载和验证配置文件、维护工作线程 工作线程处理实际的请求,Nginx 采用基于事件的模型和依赖操作系统的机制在工作线程之间高效地分发请求。工作线程的数量可配置,也可自动调整为服务器CPU的数量 一个请求,只可能在一个worker进程中处理,一个worker进程,不可能处理其它进程的请求。
  2. Nginx的高并发,官方测试支持5万并发连接。实际生产环境能到2-3万并发连接数。10000个非活跃的HTTP keep-alive 连接仅占用约2.5MB内存。三万并发连接下,10个Nginx进程,消耗内存150M。淘宝tengine团队说测试结果是“24G内存机器上,处理并发请求可达200万”。

功能应用介绍

Nginx由内核和模块组成,完成工作是通过查找配置文件将客户端请求映射到一个location block(location是用于URL匹配的命令),location配置的命令会启动不同模块完成工作 Nginx架构模块介绍

模块分类:

  • 核心模块:HTTP模块、EVENT模块(事件)、MAIL模块。
  • 基础模块:HTTP Access模块、HTTP FastCGI模块、HTTP Proxy模块、HTTP Rewrite模块。
  • 第三方模块:HTTP Upstream Request Hash模块、Notice模块、HTTP Access Key模块。

应用场景

应用场景 应用简述 实例
静态资源服务器 Http服务器,虚拟主机, 动静分离,让动态网站里的动态网页根据一定规则把不变的资源和经常变的资源区分开来,动静资源做好了拆分以后,我们就可以根据静态资源的特点将其做缓存操作,这就是网站静态化处理的核心思路 root实际访问文件路径会拼接URL中的路径 alias实际访问文件路径不会拼接URL中的路径
反向代理 简单来说就是真实的服务器不能直接被外部网络访问,所以需要一台代理服务器,而代理服务器能被外部网络访问的同时又跟真实服务器在同一个网络环境,当然也可能是同一台服务器,端口不同而已
正向代理 意思是一个位于客户端和原始服务器(origin server)之间的服务器,为了从原始服务器取得内容,客户端向代理发送一个请求并指定目标(原始服务器),然后代理向原始服务器转交请求并将获得的内容返回给客户端 代理可解决跨域问题
动态匹配 location 后可通过正则表达式进行匹配相应的请求,并对匹配的内容进行相关操作 = 表示精确匹配。只有请求的url路径与后面的字符串完全相等时,才会命中(优先级最高)。^~ 表示如果该符号后面的字符是最佳匹配,采用该规则,不再进行后续的查找。~ 表示该规则是使用正则定义的,区分大小写。~* 表示该规则是使用正则定义的,不区分大小写。
负载均衡 当有2台或以上服务器时,根据规则随机的将请求分发到指定的服务器上处理,负载均衡配置一般都需要同时配置反向代理,通过反向代理跳转到负载均衡(Nginx目前支持自带3种负载均衡策略,还有2种常用的第三方策略)
  • RR(默认,逐一分配)
  • 权重(指定轮询几率,weight和访问比率成正比,用于后端服务器性能不均的情况)
  • ip_hash(iphash的每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,可以解决session的问题)
  • fair(按后端服务器的响应时间来分配请求,响应时间短的优先分配)
  • url_hash(按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,后端服务器为缓存时比较有效。)
  • Gzip压缩 规定的三种标准HTTP压缩格式之一,对于文本文件,GZip 的效果非常明显,开启后传输所需流量大约会降至 1/4 ~ 1/3
    动态匹配
    IP限制 在location下结合 allow deny 指定限制IP访问
    限流 Nginx自身有的请求限制模块ngx_http_limit_req_module、流量限制模块ngx_stream_limit_conn_module基于令牌桶算法,可以方便的控制令牌速率,自定义调节限流,实现基本的限流控制
    适配PC或移动设备 Nginx通过内置变量$http_user_agent 在location动态匹配内容内进行判断 if ($http_user_agent ~* '(Android|webOS|iPhone|iPod|BlackBerry)') {}
    自定义错误页和访问设置
  • error_page 500 502 503 504 /50x.html;
  • error_page 404 xxxx.com;

  • 配置文件

    配置文件结构如下图:

    配置文件结构

    events { 
    
    }
    
    http 
    {
        server
        { 
            location path
            {
                ...
            }
            location path
            {
                ...
            }
         }
    
        server
        {
            ...
        }
    
    }
    

    重点讲解一下匹配规则和路径重写

    1. 匹配规则(location)

    location [=|~|~*|^~] /uri/ { … }
    
    • = 严格匹配。如果请求匹配这个location,那么将停止搜索并立即处理此请求
    • ~ 区分大小写匹配(可用正则表达式)
    • ~* 不区分大小写匹配(可用正则表达式)
    • ^~ 如果把这个前缀用于一个常规字符串,那么告诉nginx 如果路径匹配那么不测试正则表达式
    • !~ 区分大小写不匹配
    • !~* 不区分大小写不匹配
    搜索优先级
        精确匹配 > 字符串匹配( 长 > 短 [ 注: ^~ 匹配则停止匹配 ]) > 正则匹配( 上 > 下 )
    使用优先级
        精确匹配 > (^~) > 正则匹配( 上 > 下 )>字符串(长 > 端)
    

    2. 路径重写(rewrite)

    可支持正则表达式
    特殊关键字:
        rewrite … permanent   永久性重定向,请求日志中的状态码为301
        rewrite … redirect         临时重定向,请求日志中的状态码为302
        last        使用了last 指令,rewrite 后会跳出location 作用域,重新开始再走一次刚才的行为
        break    使用了break 指令,rewrite后不会跳出location 作用域,它的生命也在这个location中终结
    

    由于文章篇幅问题就不一一列举了,需要了解的小伙伴可参照链接[rewrite详细规则],在服务器上自行测试(www.cnblogs.com/netsa/p/681…)

    具体配置文件结构或者使用的配置文件说明

    • main:nginx的全局配置,对全局生效
    
    #Nginx的worker进程运行用户以及用户组
    #user  nobody nobody;
    #Nginx开启的进程数
    worker_processes  1;
    #worker_processes auto;
    #以下参数指定了哪个cpu分配给哪个进程,一般来说不用特殊指定。如果一定要设的话,用0和1指定分配方式.
    #这样设就是给1-4个进程分配单独的核来运行,出现第5个进程是就是随机分配了。eg:
    #worker_processes 4     #4核CPU 
    #worker_cpu_affinity 0001 0010 0100 1000;
    nets    
    #定义全局错误日志定义类型,[debug|info|notice|warn|crit]
    #error_log  logs/error.log  info;
    #指定进程ID存储文件位置
    #pid        logs/nginx.pid;
    #一个nginx进程打开的最多文件描述符数目,理论值应该是最多打开文件数(ulimit -n)与nginx进程数相除,但是nginx分配请求并不是那么均匀,所以最好与ulimit -n的值保持一致。
    #vim /etc/security/limits.conf
    #  *                soft    nproc          65535
    #  *                hard    nproc          65535
    #  *                soft    nofile         65535
    #  *                hard    nofile         65535
    worker_rlimit_nofile 65535;
    
    • events:配置影响nginx服务器或与用户的网络连接
    
    events {
        #use [ kqueue | rtsig | epoll | /dev/poll | select | poll ]; epoll模型是Linux 2.6以上版本内核中的高性能网络I/O模型,如果跑在FreeBSD上面,就用kqueue模型。
        use epoll;
        #每个进程可以处理的最大连接数,理论上每台nginx服务器的最大连接数为worker_processes*worker_connections。理论值:worker_rlimit_nofile/worker_processes
        #注意:最大客户数也由系统的可用socket连接数限制(~ 64K),所以设置不切实际的高没什么好处
        worker_connections  65535;    
        #worker工作方式:串行(一定程度降低负载,但服务器吞吐量大时,关闭使用并行方式)
        #multi_accept on; 
    }
    
    • http:可以嵌套多个server,配置代理,缓存,日志定义等绝大多数功能和第三方模块的配置
    #文件扩展名与文件类型映射表
        include mime.types;
        #默认文件类型
        default_type application/octet-stream;
     
    #日志相关定义
        #log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
        #                  '$status $body_bytes_sent "$http_referer" '
        #                  '"$http_user_agent" "$http_x_forwarded_for"';
        #定义日志的格式。后面定义要输出的内容。
        #1.$remote_addr 与$http_x_forwarded_for 用以记录客户端的ip地址;
        #2.$remote_user :用来记录客户端用户名称;
        #3.$time_local :用来记录访问时间与时区;
        #4.$request  :用来记录请求的url与http协议;
        #5.$status :用来记录请求状态; 
        #6.$body_bytes_sent :记录发送给客户端文件主体内容大小;
        #7.$http_referer :用来记录从那个页面链接访问过来的;
        #8.$http_user_agent :记录客户端浏览器的相关信息
        #连接日志的路径,指定的日志格式放在最后。
        #access_log  logs/access.log  main;
        #只记录更为严重的错误日志,减少IO压力
        error_log logs/error.log crit;
        #关闭日志
        #access_log  off;
     
        #默认编码
        #charset utf-8;
        #服务器名字的hash表大小
        server_names_hash_bucket_size 128;
        #客户端请求单个文件的最大字节数
        client_max_body_size 8m;
        #指定来自客户端请求头的hearerbuffer大小
        client_header_buffer_size 32k;
        #指定客户端请求中较大的消息头的缓存最大数量和大小。
        large_client_header_buffers 4 64k;
        #开启高效传输模式。
        sendfile on;
        #防止网络阻塞
        tcp_nopush on;
        tcp_nodelay on;    
        #客户端连接超时时间,单位是秒
        keepalive_timeout 60;
        #客户端请求头读取超时时间
        client_header_timeout 10;
        #设置客户端请求主体读取超时时间
        client_body_timeout 10;
        #响应客户端超时时间
        send_timeout 10;
     
    #FastCGI相关参数是为了改善网站的性能:减少资源占用,提高访问速度。
        fastcgi_connect_timeout 300;
        fastcgi_send_timeout 300;
        fastcgi_read_timeout 300;
        fastcgi_buffer_size 64k;
        fastcgi_buffers 4 64k;
        fastcgi_busy_buffers_size 128k;
        fastcgi_temp_file_write_size 128k;
     
    #gzip模块设置
        #开启gzip压缩输出
        gzip on; 
        #最小压缩文件大小
        gzip_min_length 1k; 
        #压缩缓冲区
        gzip_buffers 4 16k;
        #压缩版本(默认1.1,前端如果是squid2.5请使用1.0)
        gzip_http_version 1.0;
        #压缩等级 1-9 等级越高,压缩效果越好,节约宽带,但CPU消耗大
        gzip_comp_level 2;
        #压缩类型,默认就已经包含text/html,所以下面就不用再写了,写上去也不会有问题,但是会有一个warn。
        gzip_types text/plain application/x-javascript text/css application/xml;
        #前端缓存服务器缓存经过压缩的页面
        gzip_vary on;
    
    • server:配置虚拟主机的相关参数,一个http中可以有多个server
    • location:配置请求的路由,以及各种页面的处理情况
    • upstream:配置后端服务器具体地址,负载均衡配置不可或缺的部分
    虚拟主机定义
        server {
            #监听端口
            listen       80;
            #访问域名
            server_name  localhost;
            #编码格式,若网页格式与此不同,将被自动转码
            #charset koi8-r;
            #虚拟主机访问日志定义
            #access_log  logs/host.access.log  main;
            #对URL进行匹配
            location / {
                #访问路径,可相对也可绝对路径
                root   html;
                #首页文件。以下按顺序匹配
                index  index.html index.htm;
            }
     
    #错误信息返回页面
            #error_page  404              /404.html;
            # redirect server error pages to the static page /50x.html
            #
            error_page   500 502 503 504  /50x.html;
            location = /50x.html {
                root   html;
            }
     
    #访问URL以.php结尾则自动转交给127.0.0.1
            # proxy the PHP scripts to Apache listening on 127.0.0.1:80
            #
            #location ~ \.php$ {
            #    proxy_pass   http://127.0.0.1;
            #}
    #php脚本请求全部转发给FastCGI处理
            # pass the PHP scripts to FastCGI server listening on 127.0.0.1:9000
            #
            #location ~ \.php$ {
            #    root           html;
            #    fastcgi_pass   127.0.0.1:9000;
            #    fastcgi_index  index.php;
            #    fastcgi_param  SCRIPT_FILENAME  /scripts$fastcgi_script_name;
            #    include        fastcgi_params;
            #}
     
    #禁止访问.ht页面 (需ngx_http_access_module模块)
            # deny access to .htaccess files, if Apache's document root
            # concurs with nginx's one
            #
            #location ~ /\.ht {
            #    deny  all;
            #}
        }
    #HTTPS虚拟主机定义
        # HTTPS server
        #
        #server {
        #    listen       443 ssl;
        #    server_name  localhost;
        #    ssl_certificate      cert.pem;
        #    ssl_certificate_key  cert.key;
        #    ssl_session_cache    shared:SSL:1m;
        #    ssl_session_timeout  5m;
        #    ssl_ciphers  HIGH:!aNULL:!MD5;
        #    ssl_prefer_server_ciphers  on;
        #    location / {
        #        root   html;
        #        index  index.html index.htm;
        #    }
        #}
    #vue配置
        server {
            listen       80;
            server_name  jcsd-cdn-monitor.jdcloud.com;
     
            #charset koi8-r;
     
            #access_log  logs/host.access.log  main;
     
            root /root/dist;
     
            location / {
                try_files $uri $uri/ /index.html;
            }
     
            error_page   500 502 503 504  /50x.html;
            location = /50x.html {
                root   html;
            }
        }
    
    • Nignx状态监控
    
    #Nginx运行状态,StubStatus模块获取Nginx自启动的工作状态(编译时要开启对应功能)
            #location /NginxStatus {
            #    #启用StubStatus的工作访问状态    
            #    stub_status    on;
            #    #指定StubStaus模块的访问日志文件 可off
            #    access_log    logs/Nginxstatus.log;
            #    #Nginx认证机制(需Apache的htpasswd命令生成)
            #    #auth_basic    "NginxStatus";
            #    #用来认证的密码文件
            #    #auth_basic_user_file    ../htpasswd;    
            #}
    访问:http://IP/NginxStatus(测试就不加密码验证相关)
    
    • 反向代理
    
    #以下配置追加在HTTP的全局变量中
     
    #启动代理缓存功能
    proxy_buffering on;
    #nginx跟后端服务器连接超时时间(代理连接超时)
    proxy_connect_timeout      5;
    #后端服务器数据回传时间(代理发送超时)
    proxy_send_timeout         5;
    #连接成功后,后端服务器响应时间(代理接收超时)
    proxy_read_timeout         60;
    #设置代理服务器(nginx)保存用户头信息的缓冲区大小
    proxy_buffer_size          16k;
    #proxy_buffers缓冲区,网页平均在32k以下的话,这样设置
    proxy_buffers              4 32k;
    #高负荷下缓冲大小(proxy_buffers*2)
    proxy_busy_buffers_size    64k;
    #设定缓存文件夹大小,大于这个值,将从upstream服务器传
    proxy_temp_file_write_size 64k;
    #反向代理缓存目录
    proxy_cache_path /data/proxy/cache levels=1:2 keys_zone=cache_one:500m inactive=1d max_size=1g;
    #levels=1:2 设置目录深度,第一层目录是1个字符,第2层是2个字符
    #keys_zone:设置web缓存名称和内存缓存空间大小
    #inactive:自动清除缓存文件时间。
    #max_size:硬盘空间最大可使用值。
    #指定临时缓存文件的存储路径(必须在同一分区)
    proxy_temp_path /data/proxy/temp;
     
    #服务配置
    server {
        #侦听的80端口
        listen       80;
        server_name  localhost;
        location / {
            #反向代理缓存设置命令(proxy_cache zone|off,默认关闭所以要设置)
            proxy_cache cache_one;
            #对不同的状态码缓存不同时间
            proxy_cache_valid 200 304 12h;
            #设置以什么样参数获取缓存文件名
            proxy_cache_key $host$uri$is_args$args;
            #后端的Web服务器可以通过X-Forwarded-For获取用户真实IP
            proxy_set_header Host $host;
            proxy_set_header X-Real-IP $remote_addr; 
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;   
            #代理设置
            proxy_pass   http://IP; 
            #文件过期时间控制
            expires    1d;
        }
        #配置手动清楚缓存(实现此功能需第三方模块 ngx_cache_purge)
        #http://www.123.com/2017/0316/17.html访问
        #http://www.123.com/purge/2017/0316/17.html清楚URL缓存
        location ~ /purge(/.*) {
            allow    127.0.0.1;
            deny    all;
            proxy_cache_purge    cache_one    $host$1$is_args$args;
        }
        #设置扩展名以.jsp、.php、.jspx结尾的动态应用程序不做缓存
        location ~.*\.(jsp|php|jspx)?$ { 
            proxy_set_header Host $host; 
            proxy_set_header X-Real-IP $remote_addr; 
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;   
            proxy_pass http://IP;
            }
    
    • 负载均衡
    #负载均衡服务器池
    upstream my_server_pool {
        #调度算法
        #1.轮循(默认)(weight轮循权值)
        #2.ip_hash:根据每个请求访问IP的hash结果分配。(会话保持)
        #3.fair:根据后端服务器响应时间最短请求。(upstream_fair模块)
        #4.url_hash:根据访问的url的hash结果分配。(需hash软件包)
        #参数:
        #down:表示不参与负载均衡
        #backup:备份服务器
        #max_fails:允许最大请求错误次数
        #fail_timeout:请求失败后暂停服务时间。
        server 192.168.1.109:80 weight=1 max_fails=2 fail_timeout=30;
        server 192.168.1.108:80 weight=2 max_fails=2 fail_timeout=30;
    }
    #负载均衡调用
    server {
        ...
        location / {
        proxy_pass http://my_server_pool;
        }
    }
    
    • URL重写
    #根据不同的浏览器URL重写
    if($http_user_agent ~ Firefox){
    rewrite ^(.*)$  /firefox/$1 break; 
    }
    if($http_user_agent ~ MSIE){
    rewrite ^(.*)$  /msie/$1 break; 
    }
     
    #实现域名跳转
    location / {
        rewrite ^/(.*)$ https://web8.example.com$1 permanent;
    }
    
    • IP限制
    
    #限制IP访问
    location / {
        deny 192.168.0.2;
        allow 192.168.0.0/24;
        allow 192.168.1.1;
        deny all;
    }
    

    如何使用第三方模块以及源码编译Nginx使用,后续再一边实践一边记录分享给大家

    养成看日志的习惯

    常见问题

    • No mapping for the Unicode character exists in the target multi-byte code page

       解压的路径里面包含有中文的缘故
      
    • bind() to 0.0.0.0:80 failed (10013: An attempt was made to access a socket in a way forbidden by its access permissions)

       80端口被占用,<SQL Server Reporting Services (MSSQLSERVER)>/<World Wide Web Publishing Service> 关闭SQL/IIS
      

    相关学习链接