详解nginx的rewrite应用,Nginx高级之Rewrite规则

  • A+
所属分类:SEO蜘蛛技巧

Rewrite主要的功能是实现URL重写,Nginx 的 Rewrite 规则采用 PCRE Perl 兼容正则表达式的语法进行规则匹配,如相使用 Nginx 的 Rewrite 功能,在编译 Nginx 前要编译安装 PCRE 库。Rewrite主要实现url地址重写,以及重定向,就是把传入web的请求重定向到其他url的过程。

详解nginx的rewrite应用,Nginx高级之Rewrite规则

一、rewrite介绍

rewrite和location的功能有点相像,都能实现跳转,主要区别在于rewrite常用于同一域名内更改获取资源的路径,而location是对一类路径做控制访问和反向代理,可以proxy_pass到其他服务器。

Nginx提供的全局变量或自己设置的变量,结合正则表达式和标志位实现url重写以及重定向。

rewrite只能放在server{},location{},if{}中,

并且只能对域名后边的除去传递的参数外的字符串起作用。

二、rewrite作用及应用场景

Rewrite主要的功能就是实现URL的重写,Nginx的Rewrite规则采用Pcre,perl兼容正则表达式的语法规则匹配,如果需要Nginx的Rewrite功能,在编译Nginx之前,需要编译安装PCRE库。通过Rewrite规则,可以实现规范的URL、根据变量来做URL转向及选择配置。

作用: 实现对URL的重写以及对匹配(正则表达式)的url的重定向

场景: 

1. URL访问跳转, 支持开发设计

① 页面跳转  ② 兼容性支持  ③ 展示效果

2. SEO优化

3. 维护

① 后台维护  ② 流量转发

4. 安全

① 伪静态页面

配置语法

systax: rewrite [正则表达式 替换前的URL] [替换后的URL] [标识];

default: 无配置

二、ReWrite相关指令

指令默认值使用范围作用
breaknoneif,server,location完成当前的规则集,不再处理rewrite指令,需要和last加以区分
if ( condition ) { … }noneserver,location

用于检测一个条件是否符合,符合则执行大括号内的语句。不支持嵌套,不支持多个条件&&或处理

returnnoneserver,if,location

用于结束规则的执行和返回状态码给客户端。状态码的值可以是204,400,402,406,408,410,411,413,416以及500~504,另外非标准状态码444,表示以不发送任何的Header头来结束连接。

rewrite regex replacement flagserver,location,if

该指令根据表达式来重定向URI,或者修改字符串。

指令根据配置文件中的顺序来执行。注意重写表达式只对相对路径有效。该指令根据表达式来重定向URI,或者修改字符串。指令根据配置文件中的顺序来执行。注意重写表达式只对相对路径有效。

uninitialized_variable_warn on/offonhttp,server,location,if该指令用于开启和关闭未初始化变量的警告信息,默认值为开启。
set variable valuenone

该指令用于定义一个变量,并且给变量进行赋值。

变量的值可以是文本、一个变量或者变量和文本的联合,文本需要用引号引起来。

三、rewrite常用全局变量

详解nginx的rewrite应用,Nginx高级之Rewrite规则

详解nginx的rewrite应用,Nginx高级之Rewrite规则

四、Nginx rewrite语法

1、rewrite指令语法

指令语法: rewrite regex replacement [flag]

默认值: none

应用位置:server、location、if

rewrite是实现URL重写的关键指令,根据regex(正则表达式)部分的内容,重定向到replacement部分,结尾是flag标记。

下面是一个简单地URL rewrite跳转的例子:

    rewrite ^/(.*) http://www.cjzzc.com/$1 permanent;

在上述指令中,rewrite为固定关键字,表示开启一条rewrite匹配规则,regex部分是^/(.*),这是一个正则表达式,表示匹配所有,匹配成功后跳转到http://www.cjzzc.com/$1。这里的$1是取前面regex部分括号里的内容结尾的permanent;是永久301重定向标记,即跳转到后面的http://www.cjzzc.com/$1地址上。

2、rewrite指令结尾的flag标记说明

flag标记符号说 明
last本条规则匹配完成后,继续向下匹配新的location URI规则
break本条规则匹配完成即终止,不再匹配后面的任何规则
redirect返回302临时重定向,浏览器地址栏会显示跳转后的URL地址
permanent返回301永久重定向,浏览器地址栏会显示跳转后的URL地址

在以上的flag标记中,last和break用来实现URL重写,浏览器地址栏的URL地址不变,但在服务器访问的程序及路径发生了变化。redirect和permanent用来实现URL跳转,浏览器地址会显示跳转后的URL地址。

last和break标记的实现功能类似,但二者之间有细微的差别,使用alias指令时必须用last标记,使用proxy_pass指令时要使用break标记。

last标记在本条rewrite规则执行完毕后,会对其所在的server{…}标签重新发起请求,而break标记则会在本条规则匹配完成后,终止匹配,不再匹配后面的规则。

五、例子

1、 break

参数项:break,用于停止执行rewrite模块的指令,但是其他模块不受影响。

配置位置:server,location,if

示例

    server {
        listen       80;
        server_name  localhost;
        #===== break && rewrite test =====
        #这里如果注释掉break,所有请求进来都是返回http200,this is breaktest...
        break;
        return 200 "this is breaktest...";
        location = /breaktest {
            break;
            return 200 $request_uri;
            proxy_pass http://192.168.88.38/other;
        }
        location / {
            return 200 $request_uri;
        }    
    }
    
    # 发送请求如下
    # curl 127.0.0.1:8080/testbreak
    # /other
    # 可以看到 返回 `/other` 而不是 `/testbreak`,说明 `proxy_pass` 指令还是被执行了
    # 也就是说 其他模块的指令是不会被 break 中断执行的
    #(proxy_pass是ngx_http_proxy_module的指令)

测试链接:http://192.168.88.38/breaktest ,请求到达server块后,被break终止执行rewrite指令集,return属于rewrite模块指令集,所以return 200 “this is breaktest…”不会执行;

因为没有返回结果,所以继续执行location匹配,请求匹配到location = /breaktest{}之后,break终止return 200 $request_uri,而proxy_pass属于ngx_http_proxy_module,仍会继续执行,

反向代理后的新url匹配到location /{},因此最终返回结果为 http200,/other,如下图:

详解nginx的rewrite应用,Nginx高级之Rewrite规则

2、set

配置位置:server,location,if,用于为变量赋值

示例:

    server {
        listen       80;
        server_name  localhost;
        #===== break && rewrite test =====
        #这里如果注释掉break,所有请求进来都是返回http200,this is breaktest...
        break;
        return 200 "this is breaktest...";
        location = /breaktest {
            break;
            return 200 $request_uri;
            proxy_pass http://192.168.88.38/other;
        }
        location / {
            #set赋值,可以直接赋字符串,或是变量,如下是变量和字符串的组合
            set $set_value_test “112233 $request_uri”;
            return 200 $set_value_test;
        }    
     }

测试链接http://192.168.88.38/breaktest,使用效果如下图:

详解nginx的rewrite应用,Nginx高级之Rewrite规则

3.if

配置位置:server,location,用于依据指定的条件,决定是否执行if块中的语句

判断条件:

3.1.变量值为空或为0,都为false;

示例:

    set $if_value_test “0”;
      #注意这里if、()和{}要空格,否则会报错..略坑,不过这也是代码规范了
      if ($if_value_test) {
         #不会执行,因为$if_value_test值为0,false
         return 200;
    }

3.2.变量与字符串比较,=为等于,!=为不等

3.3.变量与正则表达式匹配,~ 为区分大小写匹配,~* 为不区分大小写匹配,!~ , !~*前面两者的非操作

示例:

    if ($request_uri ~ “^/breaktest$”) {
      #测试链接http://192.168.88.38/breaktest,最终返回http200
      return 200;
    }

3.4.检查文件是否存在,-f存在即为true,!-f不存在即为true

3.5.检查目录是否存在,-d存在即为true,!-d不存在即为true

3.6.检查文件或目录是否存在,-e存在即为true,!-e不存在即为true

3.7.检查文件是否可执行,-x可执行即为true,!-x不可执行即为true

示例:

    if (-e /usr/local/nginx/conf) {
      return 200;
    }

其他示例:

    if ($http_user_agent ~ MSIE) {
    
        rewrite ^(.*)$ /msie/$1 break;

    } //如果UA包含"MSIE",rewrite请求到/msid/目录下

    if ($http_cookie ~* "id=([^;]+)(?:;|$)") {
   
        set $id $1;
    
    } //如果cookie匹配正则,设置变量$id等于正则引用部分
      
    if ($request_method = POST) {
    
        return 405;
    
    } //如果提交方法为POST,则返回状态405(Method not allowed)。return不能返回301,302
    
    if ($slow) {
        limit_rate 10k;
    
    } //限速,$slow可以通过 set 指令设置
    
    if (!-f $request_filename){
        break;
        proxy_pass  http://127.0.0.1; 
    } //如果请求的文件名不存在,则反向代理到localhost 。这里的break也是停止rewrite检查
    
    if ($args ~ post=140){
        rewrite ^ http://mysite.com/ permanent;
    
    } //如果query string中包含"post=140",永久重定向到mysite.com
  1. if指令中,可以使用全局变量,这些变量有:

  2. $ args: #这个变量等于请求行中的参数,同$query_string

  3. $ content_length: 请求头中的Content-length字段。

  4. $content_type: 请求头中的Content-Type字段。

  5. $document_root: 当前请求在root指令中指定的值。

  6. $host: 请求主机头字段,否则为服务器名称。

  7. $http_user_agent: 客户端agent信息

  8. $http_cookie: 客户端cookie信息

  9. $limit_rate: 这个变量可以限制连接速率。

  10. $request_method: 客户端请求的动作,通常为GET或POST。

  11. $remote_addr: 客户端的IP地址。

  12. $remote_port: 客户端的端口。

  13. $remote_user: 已经经过Auth Basic Module验证的用户名。

  14. $request_filename: 当前请求的文件路径,由root或alias指令与URI请求生成。

  15. $scheme: HTTP协议(如http,https)。

  16. $server_protocol: 请求使用的协议,通常是HTTP/1.0或HTTP/1.1。

  17. $server_addr: 服务器地址,在完成一次系统调用后可以确定这个值。

  18. $server_name: 服务器名称。

  19. $server_port: 请求到达服务器的端口号。

  20. $request_uri: 包含请求参数的原始URI,不包含主机名,如:”/foo/bar.php?arg=baz”。

  21. $ uri: 不带请求参数的当前URI,$uri不包含主机名,如”/foo/bar.html”。

  22. $ document_uri: 与$uri相同。

4.return

配置位置:server,location,if

参数值:return code [text]返回状态码及文本、return url重定向、return code url重定向

5.rewrite

配置位置:server,location,if

参数值:rewrite regex replacement [flag],用于以正则表达式匹配特定格式的url并重写url.

regex为正则表达式,replacement为重写的内容,flag为rewrite的标识位

replacement:重写的url带http,表示重定向

示例:

    location / {    
        #测试链接http://192.168.88.38/test/,被重定向到百度首页,后面的语句不会再执行
        rewrite /test/(.*) http://www.baidu.com;
        set $set_value_test "112233 $request_uri";
        return 200 $set_value_test;
    }

replacement:重写的url不带http,单纯的重写url

示例:

    location / {
       #测试链接http://192.168.88.38/test/,匹配到location /{}后url被重写为http://192.168.88.38/breaktest,继续搜索匹配
       #匹配到location = /breaktest{},最终返回http200及this is breaktest
       rewrite /test/(.*) /breaktest;
    }
    location = /breaktest {
       return 200 "this is breaktest";
    }

6、flag

flag:用于设置重写url后的进一步操作,有break,last,redirect,permanent,rewrite不带flag时,多个rewrite指令顺序执行,当location中没有可执行的rewrite模块指令时,重新发起一次location匹配,下面说明各个flag的用途:

break:和上面讲的break用途及用法一样,终止执行rewrite模块指令集;

last:终止执行rewrite模块指令集,并开始搜寻重写url后匹配的location;

redirect:临时重定向

permanent:永久重定向

示例:

     location / {
        #测试链接http://192.168.88.38/test1,匹配到location / {}
        rewrite ^/test1 /test2;#被重写为/test2,继续往下执行rewrite
        rewrite ^/test2 /test3;#被重写为/test3,往下没有可执行的rewrite模块指令,发起一次location匹配,匹配到location /test3 {},最终返回http200及/test3
     }
     location /test2 {
        return 200 "/test2";
     }
     location /test3 {
        return 200 "/test3";
     }

last和break的区别在于,last会发起新的location匹配,而break不会。

示例:

        location / {
           rewrite ^/test1 /test2;
           rewrite ^/test2 /test3 last;
           rewrite ^/test3 /test4;
        }
        location /test2 {
            return 200 "/test2";
        }
        location /test3 {
            return 200 "/test3";
        }
        location /test4 {
            return 200 "/test4";
        }

测试链接:http://192.168.88.38/test1 匹配到 location / {}后,被重写为/test2,顺序执行再次被重写为/test3,因为flag为last,所以不会继续重写为/test4,而是发起一次location匹配,匹配到location /test3{},所以最终返回结果为http200及/test3;

如果把location /{}中的last改为break,被重写为/test3后,不再重写为/test4,也不会发起location,最终没有可匹配的资源,返回http404。

7、正则匹配URL的参数传递

小括号()之间匹配的内容,可以在后面通过 $下标 来引用,如1 表 示 引 用 第 一 个 小 括 号 匹 配 的 内 容 , 1表示引用第一个小括号匹配的内容,1表示引用第一个小括号匹配的内容,表示引用第二个小括号匹配的内容。

示例:

        location / {
           rewrite ^/(test1)/(test2)/(test3) /$2/$3;
           return 200 $2-$3;
        }

最终返回结果:

详解nginx的rewrite应用,Nginx高级之Rewrite规则

  • 我的微信
  • weinxin
  • 微信公众号
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: