Nginx Rewrite

376 阅读2分钟

image.png


常用的Nginx 正则表达式

符号作用
^匹配输入字符串的起始位置
$匹配输入字符串的结束位置
*匹配前面的字符零次或多次。如"ol*"能匹配"o"及"ol"、"oll"
+匹配前面的字符一次或多次。如"ol+"能匹配"ol"及"oll"、"olll",但不能匹配"o"
?匹配前面的字符零次或一次,例如"do(es) ?"能匹配"do"或者"does","?"等效于"{0,1}"
.匹配除"\n"之外的任何单个字符,若要匹配包括"\n"在内的任意字符,请使用诸如"[.\n]"之类的模式
\将后面接着的字符标记为一个特殊字符或一个原义字符或一个向后引用。如"\n"匹配一个换行符,而".S"则匹配"5"
\d匹配纯数字[0-9]
\s空白符
\w任意单词字符包括下划线[A-Za-z0-9_]
{n}重复n 次
{n,1}重复n次或更多次
{n,m}重复n 到m次
[]定义匹配的字符范围
[c]匹配单个字符c
[a-z]匹配 a-z小写字母的任意一个
[^a-z]反向匹配,不匹配a-z小写字母的任意一个
[a-zA-Z0-9]匹配所有大小写字母或数字
()表达式的开始和结束位置
|或运算符

location

从功能看rewrite和 location似乎有点像,都能实现跳转,主要区别在于rewrite是在同一域名内更改获取资源的路径,而 location是对一类路径做控制访问或反向代理,还可以proxy_pass 到其他机器。

  • rewrite:对访问的域名或者域名内的URL路径地址重写(对用户访问的域名或者URL路径进行地址重写,然后再根据location的匹配跳转页面)
  • location:对访问的路径做访问控制或者代理转发(匹配用户的url访问路径路径,跳转页面)

location三类

  • 精准匹配: location = / {...}
  • 一般匹配: location / {...}
  • 正则匹配: location ~ / (...}

location常用的匹配规则

  • -:进行普通字符精确匹配,也就是完全匹配
  • ^~:表示普通字符匹配。使用前缀匹配。如果匹配成功,则不再匹配其它 location
  • ~:区分大小写的匹配
  • ~*:不区分大小写的匹配
  • !~:区分大小写的匹配取非
  • !~*:不区分大小写的匹配取

  1. location = / {}

    • =为精确匹配 / ,主机名后面不能带任何字符串,比如访问 / 和 /data,则 / 匹配,/data 不匹配
    • 比如 location = /abc,则只匹配/abc ,/abc/或 /abcd不匹配。若 location  /abc,则可以匹配/abc 、/abcd/ 同时也匹配 /abc/。
  2. location / {}

    • 因为所有的地址都以 / 开头,所以这条规则将匹配到所有请求。比如访问 / 和 /data, 则 / 匹配, /data 也匹配,
    • 但后面前缀路径会和最长字符串优先匹配
  3. location /documents/ {}

    • 匹配任何以 /documents/ 开头的地址,匹配符合以后,还要继续往下搜索其它 location,只有其它 location后面的前缀路径没有匹配到时,才会采用这一条
  4. location /documents/abc {}

    • 匹配任何以 /documents/abc 开头的地址,匹配符合以后,还要继续往下搜索其它 location,只有其它 location后面的前缀路径没有匹配到时,才会采用这一条
  5. location ^~ /images/ {}

    • 匹配任何以 /images/ 开头的地址,匹配符合以后,停止往下搜索正则,采用这一条
  6. location ~* .(gif|jpg|jpeg)$ {}

    • 匹配所有以 gif、jpg或jpeg 结尾的请求
    • 然而,所有请求 /images/ 下的图片会被 location ^~ /images/ 处理,因为 ^~ 的优先级更高,所以到达不了这一条正则
  7. location /images/abc {}

    • 最长字符匹配到 /images/abc,优先级最低,继续往下搜索其它 location,会发现 ^~ 和 ~ 存在。如果又发现匹配的 ^~ 和 ~ ,那么因为优先级问题,这条匹配将不会有效
  8. location ~ /images/abc {}

    • 匹配以/images/abc 开头的,优先级次之,只有去掉 location ^~ /images/ 才会采用这一条
  9. location /images/abc/1.html {}

    • 匹配/images/abc/1.html 文件,如果和正则location ~ /images/abc/1.html 相比,正则优先级更高

匹配优先级

精准匹配(location =完整路径)>>前缀匹配(location ^~ 前缀路径)>>正则匹配(location ,* 正则表达式)>>一般匹配(location 前缀路径)>>通用匹配( location / )

在没有精准匹配的情况下,先看前缀匹配的长度,然后根据最长的前缀匹配的优先级去确定是否再去匹配其它正则匹配location。

  • 如果最长的前缀匹配带有^~ ,则不再匹配其它正则匹配location
  • 如果最长的前缀匹配是没有修饰符一般匹配,则会再匹配其它正则匹配loation

前缀匹配:看长度,最长的优先匹配
正则匹配:看上下顺序、上面的优先

只有在精准、前缀、正则、一般都没有匹配到的时候才会看通用匹配

实际网站使用中,至少有三个匹配规则定义
  • 第一个必选规则,直接匹配网站根目录首页,通过域名访问网站首页比较频繁,使用这个会加速处理,比如说官网(可以是一个静态首页,也可以直接转发给后端应用服务器)
location = /index.html {
    root   html;
	index  index.html index.htm;
}
  • 第二个必选规则,是处理静态文件请求,有两种配置模式,目录匹配或后缀匹配,任选其一或搭配使用
location ^~ /static/ {
    root /webroot/;
}

location ~* \.(gif|jpg|jpeg|png|css|js|ico)$ {
    root /webroot/res/;
}
  • 第三个通用规则,比如用来转发带.php、.jsp后缀的动态请求到后端应用服务器,非静态文件请求就默认是动态请求
location / {
    proxy_pass http://tomcat_server;
}

rewrite

rewrite功能是,使用nginx提供的全局变量或自己设置的变量,结合正则表达式和标记位实现URL重写以及重定向。

rewrite只能放在server{},location{},if{}中,并且默认只能对域名后边的除去传递的参数外的字符串起作用
例如:www.abc.com/abc/bbs/ind…  ,只对/abc/bbs/index.php重写。

rewrite跳转实现

image.png

  • Nginx:通过ngx_http_rewrite_module 模块支持URL重写、支持if条件判断,但不支持else
  • 跳转:从一个 location跳转到另一个location,循环最多可以执行10次,超过后nginx将返回500错误
  • PCRE支持:perl兼容正则表达式的语法规则匹配
  • 重写模块 set 指令:创建新的变量并设其值

rewrite执行顺序

  1. 执行 server 块里面的 rewrite 指令。
  2. 执行 location 匹配。
  3. 执行选定的 location 中的 rewrite 指令。

rewrite语法格式rewrite <regex> <replacement> [flag]

  • regex :表示正则匹配规则。
  • replacement :表示跳转后的内容。
  • flag :表示 rewrite 支持的 flag 标记。

flag标记说明

  • last :本条规则匹配完成后,不终止重写后的url匹配,一般用在 server 和 if 中。
  • break :本条规则匹配完成即终止,终止重写后的url匹配,一般使用在 location 中。
  • redirect :返回302临时重定向,浏览器地址会显示跳转后的URL地址。
  • permanent :返回301永久重定向,浏览器地址栏会显示跳转后的URL地址。

rewrite 示例

基于域名的跳转

现有旧域名www.abc.com ,现需要使用新域名www.qwer.com 代替,但是旧域名不能废除,需要跳转到新域名上,而且后面的参数保持不变。

步骤
  1. 修改配置文件/usr/local/nginx/conf/nginx.conf image.png

  2. 设置域名解析 image.png

  3. 重启服务后,浏览器查看
    因为flag标记为permanent,浏览器地址栏会显示跳转后的URL地址 image.png

  4. 创建子目录和新的文件 image.png

  5. 浏览器输入模拟访问 www.abc.com/test/1.html ,会跳转到www.qwer.com/test/1.html ,查看元素可以看到返回301,实现了永久重定向跳转,而且域名后的参数也正常跳转。 image.png

基于客户端 IP 访问跳转

要求所有 IP 访问任何内容都显示一个固定维护页面,只有内网IP:192.168.44.20访问正常

步骤
  1. /var/www/html目录下创建维护界面 image.png

  2. 修改配置文件/usr/local/nginx/conf/nginx.conf image.png

  3. 重启服务后,浏览器查看

    • 不是192.168.44.20访问 image.png

    • 192.168.44.20访问,不受影响 image.png

:如果rewrite (.+) /weihu.html;换成rewrite (.+) /weihu.html permanent; 的话,若不是 192.168.44.20 的主机访问会使浏览器修改请求访问的 URL 成 www.abc.com/weihu.html 再请求访问,这样就会进入一直在 rewrite 的死循环,访问请求会一直被重写成 www.abc.com/weihu.html 再请求访问。

基于旧域名跳转到新域名后面加目录

现在访问的是 bbs.abc.com/post/ ,现在需要将这个域名下面的访问都跳转到www.abc.com/bbs/post/

步骤
  1. 修改配置文件/usr/local/nginx/conf/nginx.conf image.png

  2. 创建跳转的访问文件 image.png

  3. 设置域名解析 image.png

  4. 重启服务,浏览器访问 image.png

基于参数匹配的跳转

访问www.abc.com/100-(100|20… 跳转到www.abc.com 页面。

步骤
  1. 修改配置文件/usr/local/nginx/conf/nginx.conf image.png
作用
$request_uri包含请求参数的原始URI,不包含主机名,如:www.abc.com/abc/bbs/ind… 中的 /abc/bbs/index.php?a=1&b=2
$uri这个变量指当前的请求URI,不包括任何参数,如:/abc/bbs/index.html
$document_uri与$uri相同,这个变量指当前的请求URI,不包括任何传递参数,如:/abc/bbs/index.html
  1. 重启服务,浏览器访问 image.png image.png