前言
大家好,我是老马。很高兴遇到你。
我们为 java 开发者实现了 java 版本的 nginx
如果你想知道 servlet 如何处理的,可以参考我的另一个项目:
手写从零实现简易版 tomcat minicat
手写 nginx 系列
如果你对 nginx 原理感兴趣,可以阅读:
从零手写实现 nginx-01-为什么不能有 java 版本的 nginx?
从零手写实现 nginx-03-nginx 基于 Netty 实现
从零手写实现 nginx-04-基于 netty http 出入参优化处理
从零手写实现 nginx-05-MIME类型(Multipurpose Internet Mail Extensions,多用途互联网邮件扩展类型)
从零手写实现 nginx-12-keep-alive 连接复用
从零手写实现 nginx-13-nginx.conf 配置文件介绍
从零手写实现 nginx-14-nginx.conf 和 hocon 格式有关系吗?
从零手写实现 nginx-15-nginx.conf 如何通过 java 解析处理?
从零手写实现 nginx-16-nginx 支持配置多个 server
从零手写实现 nginx-18-nginx 请求头+响应头操作
从零手写实现 nginx-20-nginx 占位符 placeholder
从零手写实现 nginx-21-nginx modules 模块信息概览
从零手写实现 nginx-22-nginx modules 分模块加载优化
从零手写实现 nginx-23-nginx cookie 的操作处理
从零手写实现 nginx-26-nginx rewrite 指令
小结
本节我们实现了文件的压缩处理,这个对于文件的传输性能提升比较大。
当然,压缩+解压本身也是对性能有损耗的。要结合具体的压缩比等考虑。
下一节,我们考虑实现一下 cors 的支持。
我是老马,期待与你的下次重逢。
开源地址
为了便于大家学习,已经将 nginx 开源
chat
详细介绍一下 nginx 的 rewrite
Nginx 的 rewrite
指令用于对 URL 进行重写(Rewrite),即将用户请求的 URL 按照指定的规则修改成新的 URL,然后再进行后续处理或跳转。
它通常用于实现 URL 重定向、SEO 优化、URL 简化等功能。
基本语法
rewrite
指令的基本语法如下:
rewrite regex replacement [flag];
regex
: 正则表达式,用于匹配请求的 URL。replacement
: 重写后的新 URL,可以包含捕获组(从regex
中捕获的部分)。flag
: 可选参数,表示重写后的行为。
常见的 flag
last
: 停止当前所在的rewrite
指令所在的位置,并重新搜索新的 location。相当于 Apache 的L
标志。break
: 停止处理当前的rewrite
指令,但继续处理剩下的指令,不会重新搜索 location。redirect
: 返回 302 临时重定向。permanent
: 返回 301 永久重定向。
示例讲解
基本重写
将所有访问 http://example.com/old-path
的请求重写为 http://example.com/new-path
:
server {
listen 80;
server_name example.com;
location / {
rewrite ^/old-path$ /new-path break;
}
}
捕获组
使用正则表达式的捕获组,将动态路径的一部分包含在新的路径中:
server {
listen 80;
server_name example.com;
location / {
rewrite ^/product/(\d+)$ /new-product/$1 break;
}
}
在这个示例中,/product/123
将被重写为 /new-product/123
。
永久重定向
实现 301 永久重定向,将 http://example.com/old-page
重定向到 http://example.com/new-page
:
server {
listen 80;
server_name example.com;
location / {
rewrite ^/old-page$ /new-page permanent;
}
}
带查询参数的重写
将带有查询参数的 URL 重写为不同的路径:
server {
listen 80;
server_name example.com;
location / {
if ($arg_id) {
rewrite ^/details$ /details/$arg_id? last;
}
}
}
在这个示例中,如果请求 URL 是 http://example.com/details?id=123
,它将被重写为 http://example.com/details/123
。
使用变量
Nginx 支持使用变量来动态重写 URL:
server {
listen 80;
server_name example.com;
location / {
set $new_url /new-path;
rewrite ^/old-path$ $new_url break;
}
}
使用场景
- SEO 优化:将不友好的 URL 重写为更易读和包含关键词的 URL。
- 迁移兼容:网站路径结构调整后,通过重写规则保持旧链接的有效性。
- 访问控制:对特定路径进行条件性的访问控制,通过重写指向相应的处理脚本。
- 负载均衡:在负载均衡器上,通过重写规则将请求分发到不同的后端服务器。
注意事项
- 正则表达式:编写和测试正则表达式时需要特别小心,以确保匹配的准确性。
- 顺序:
rewrite
指令的顺序会影响重写的结果,因此应根据实际需求合理安排重写规则。 - 性能:大量的重写规则可能影响 Nginx 的性能,应尽量简化和优化规则。
通过合理使用 Nginx 的 rewrite
指令,可以实现灵活的 URL 重写和重定向,满足各种应用需求。
为什么 nginx 需要 rewrite?
Nginx 需要 rewrite
指令的主要原因在于它能够灵活地处理和修改客户端请求的 URL,以满足不同的需求。
这些需求包括但不限于 URL 重定向、SEO 优化、旧链接兼容性、访问控制和负载均衡等。
具体来说,以下是几个主要的原因:
1. SEO 优化
搜索引擎更倾向于友好且包含关键词的 URL。通过 rewrite
,可以将复杂或不友好的 URL 转换为简洁且易于理解的 URL,从而提升网页的 SEO 排名。
rewrite ^/product/view/(\d+)$ /products/$1 permanent;
2. 旧链接兼容性
当网站的路径结构发生变化时,通过 rewrite
指令,可以将旧的 URL 重定向到新的 URL,从而保持旧链接的有效性,避免因链接失效而导致的用户流失或 SEO 损失。
rewrite ^/old-path$ /new-path permanent;
3. 访问控制
可以根据 URL 路径来实现访问控制。例如,将某些路径的请求重定向到一个特定的处理脚本或页面,从而实现权限控制或内容过滤。
rewrite ^/admin$ /admin-login.html break;
4. 负载均衡
在负载均衡器上,通过 rewrite
指令,可以根据请求的 URL 动态地将请求分发到不同的后端服务器或服务,从而实现负载均衡和高可用性。
location / {
if ($request_uri ~* "/api") {
rewrite ^(.*)$ http://api-server$1 break;
}
}
5. 统一资源路径
通过 rewrite
,可以将不同格式或规则的 URL 统一到一个标准路径,从而简化后端的处理逻辑。例如,将所有的 index.php
请求统一重定向到根路径。
rewrite ^/index.php/(.*)$ /$1 break;
6. 动态 URL 重写
在某些情况下,需要根据请求中的参数或路径部分动态生成新的 URL。rewrite
指令允许使用正则表达式和变量来实现这种动态重写。
rewrite ^/user/(\d+)$ /profile?id=$1 break;
7. 简化配置
有时候,重写规则可以简化 Nginx 的配置,避免在不同 location 中重复配置相同的处理逻辑。例如,将所有以 /old
开头的路径重写到 /new
,只需一条 rewrite
指令。
rewrite ^/old/(.*)$ /new/$1 break;
总结
通过使用 Nginx 的 rewrite
指令,可以灵活地管理和修改 URL,从而实现更好的用户体验、SEO 优化、访问控制和系统维护。
这使得 Nginx 能够适应各种复杂的应用场景,并在保持高性能的同时提供强大的功能。
给出 nginx rewrite 的使用例子
当然,以下是几个常见的 Nginx rewrite
指令使用示例,涵盖了不同的应用场景:
1. 基本 URL 重写
将 /old-path
重写为 /new-path
,但保持浏览器地址栏不变(内部重写)。
server {
listen 80;
server_name example.com;
location / {
rewrite ^/old-path$ /new-path break;
}
}
2. 简单的 URL 重定向
将 /old-page
重定向到 /new-page
,并返回 301 永久重定向。
server {
listen 80;
server_name example.com;
location / {
rewrite ^/old-page$ /new-page permanent;
}
}
3. 动态 URL 重写
使用正则表达式和捕获组,将动态路径的一部分包含在新的路径中。
比如,将 /product/123
重写为 /new-product/123
。
server {
listen 80;
server_name example.com;
location / {
rewrite ^/product/(\d+)$ /new-product/$1 break;
}
}
4. 带查询参数的重写
将带有查询参数的 URL 重写为不同的路径。例如,将 /details?id=123
重写为 /details/123
。
server {
listen 80;
server_name example.com;
location / {
if ($arg_id) {
rewrite ^/details$ /details/$arg_id? last;
}
}
}
5. 条件重写
根据请求头或其他条件重写 URL。例如,如果请求的主机名是 old.example.com
,则重写为 new.example.com
。
server {
listen 80;
server_name old.example.com;
location / {
rewrite ^/(.*)$ http://new.example.com/$1 permanent;
}
}
6. 使用变量
通过变量动态地重写 URL。例如,根据请求的 URI 动态地设置新的路径。
server {
listen 80;
server_name example.com;
location / {
set $new_url /new-path;
rewrite ^/old-path$ $new_url break;
}
}
7. 将所有请求重写到单一入口点
常见于单页应用(SPA)或使用前端路由的应用,将所有请求重写到 index.html
。
server {
listen 80;
server_name example.com;
location / {
try_files $uri $uri/ /index.html;
}
}
8. 禁止特定路径访问
如果需要禁止访问某些路径,可以将这些路径重写到一个错误页面或直接返回 403 Forbidden。
server {
listen 80;
server_name example.com;
location / {
rewrite ^/admin/.*$ /forbidden.html break;
}
location = /forbidden.html {
internal;
}
}
9. 处理 HTTPS 重定向
将所有 HTTP 请求重定向到 HTTPS,以确保安全性。
server {
listen 80;
server_name example.com;
location / {
rewrite ^/(.*)$ https://example.com/$1 permanent;
}
}
10. 负载均衡
在负载均衡器上,通过重写规则将请求分发到不同的后端服务器。
upstream backend {
server backend1.example.com;
server backend2.example.com;
}
server {
listen 80;
server_name example.com;
location / {
proxy_pass http://backend;
}
location /api {
rewrite ^/api/(.*)$ /$1 break;
proxy_pass http://backend/api;
}
}
这些示例展示了 Nginx rewrite
指令的多种应用场景,从简单的 URL 重写到复杂的条件重写和负载均衡。
根据具体需求,可以灵活地配置和组合这些规则,以实现预期的效果。
nginx rewrite 有哪些优缺点?
Nginx rewrite
指令在URL重写和重定向方面提供了强大的功能,但也有其优缺点。以下是对其优缺点的详细分析:
优点
- 灵活性高
rewrite
指令使用正则表达式,可以处理复杂的URL重写需求,几乎可以满足任何URL重写的场景。
- 性能高
- Nginx 本身是一个高性能的HTTP服务器,
rewrite
指令的执行效率很高,不会显著影响服务器的性能。
- Nginx 本身是一个高性能的HTTP服务器,
- 丰富的功能
- 可以进行内部重写、临时重定向、永久重定向,还可以根据请求的条件(如请求头、变量等)进行重写和重定向。
- SEO优化
- 通过重写URL,可以使网站的URL更加友好,有利于搜索引擎优化(SEO)。
- 兼容性
- 可以保持旧链接的有效性,通过重写规则将旧的URL重定向到新的URL,保证网站迁移或路径结构调整后的兼容性。
- 简化配置
- 可以通过简单的重写规则实现复杂的URL路由逻辑,简化服务器配置。
缺点
- 配置复杂
- 对于不熟悉正则表达式的用户来说,编写和调试
rewrite
规则可能比较困难,容易出错。
- 对于不熟悉正则表达式的用户来说,编写和调试
- 可读性差
- 复杂的重写规则可能导致配置文件的可读性降低,维护起来比较困难。
- 错误处理困难
- 当重写规则出现错误时,可能导致请求无法正确路由,调试这些问题通常需要一些经验。
- 影响缓存
- URL的重写可能会影响缓存策略,因为重写后的URL和原始URL可能被视为不同的资源,从而导致缓存命中率降低。
- 潜在的性能开销
- 虽然Nginx的性能较高,但复杂的重写规则仍可能在高流量情况下带来一定的性能开销,尤其是当规则涉及大量正则表达式匹配时。
- 安全风险
- 不当的重写规则可能引发安全问题,例如URL重写导致的路径遍历攻击等,需要仔细设计和验证规则。
总结
Nginx rewrite
指令是一个非常强大且灵活的工具,可以极大地满足各种复杂的URL重写和重定向需求。
它的高性能和丰富的功能使得它在许多场景中非常有用。
然而,它的配置复杂性和潜在的错误风险也需要管理员在使用时保持谨慎,确保规则的正确性和安全性。
通过合理的设计和优化,可以最大程度地发挥rewrite
指令的优势,满足应用需求。
如果让你设计 rewrite 指令,你会如何设计?为什么
设计一个URL重写指令时,需要考虑简洁性、易用性、灵活性和性能等多个方面。
以下是一个改进版的重写指令设计思路,并附上设计理由:
设计目标
- 易用性:让用户更容易编写和理解重写规则。
- 灵活性:支持复杂的URL重写需求。
- 性能:保持高效的处理性能。
- 安全性:减少潜在的安全风险。
设计思路
- 简化语法:提供更直观的语法,减少对正则表达式的依赖。
- 条件支持:允许根据请求头、查询参数等条件进行重写。
- 调试工具:提供调试工具和详细的错误信息。
- 内置变量:预定义一些常用变量,减少用户记忆负担。
- 分组和优先级:支持规则分组和优先级设置,简化复杂配置。
重写指令设计示例
基本语法
rewrite [pattern] [replacement] [flag] [condition];
pattern
: 匹配模式,支持简单模式和正则表达式。replacement
: 重写后的URL,可以包含捕获组。flag
: 可选参数,表示重写后的行为(如last
、break
、redirect
、permanent
)。condition
: 可选参数,表示重写规则生效的条件。
示例
- 简单重写
rewrite /old-path /new-path;
- 将
/old-path
重写为/new-path
。
- 正则表达式重写
rewrite ^/product/(\d+)$ /new-product/$1;
- 将
/product/123
重写为/new-product/123
。
- 条件重写
rewrite ^/details$ /details/$arg_id if ($arg_id);
- 如果存在查询参数
id
,将/details?id=123
重写为/details/123
。
- 重定向
rewrite ^/old-page$ /new-page permanent;
- 将
/old-page
重定向到/new-page
,返回301永久重定向。
- 条件与请求头
rewrite ^/admin$ /admin-login.html if ($http_user_agent ~* "bot");
- 如果用户代理包含 “bot”,将
/admin
重写为/admin-login.html
。
- 分组和优先级
rewrite group main {
priority 1;
rewrite /old-path /new-path;
rewrite ^/product/(\d+)$ /new-product/$1;
}
- 将规则分组,并设置优先级。
理由
- 简化语法:使用简单的模式匹配,减少用户对正则表达式的依赖,降低使用门槛。
- 条件支持:允许根据请求头、查询参数等条件进行重写,增强灵活性。
- 调试工具:提供调试工具和详细的错误信息,方便用户调试和排查问题。
- 内置变量:预定义一些常用变量,如
$arg_id
、$http_user_agent
,减少用户记忆负担。 - 分组和优先级:支持规则分组和优先级设置,使得复杂配置更易于管理。
实现
为实现这些设计,需要在Nginx核心中扩展现有的rewrite模块,增加对条件、分组、优先级和调试工具的支持。
同时,优化正则表达式的处理性能,确保重写指令的高效执行。
通过这样的设计,可以显著提升Nginx重写指令的易用性和灵活性,同时保持高效的性能和安全性。
参考资料
更多学习
更多实时资讯,前沿技术,生活趣事。尽在【老马啸西风】
交流社群:[交流群信息](https://mp.weixin.qq.com/s/rkSvXxiiLGjl3S-ZOZCr0Q)