技术解析

如何在 nginx 用正则表达式提取内容?
0
2021-05-20 19:32:34
idczone

如我把本地浏览器 UA 改成了 Mozilla/国外服务器5.0 (Windows NT 10.0; WOW64; rv:48.0) Gecko/20100101 Firefox/48.0 name 也就是在后面加个空格和 name

在 nginx 的配置文件中,我想提取$http_user_agent 中最后这个加的 name

    if ($http_user_agent ~ (这里正则表达式) {
        set $user "$user";
    }

这里正则表达式怎么写,或者如何提取$http_user_agent 的后面一个空格和空格后面的 name 呢? 求指教!


比如 Mozilla/5.0 (Windows NT 10.0; WOW64; rv:48.0) Gecko/20100101 Firefox/48.0 tanteng 这个 User-Agent ,用正则 /[ ]([\S]+)/ 可以匹配所有空格+非空格内容,这样会匹配到多个内容,但是 nginx 里怎么取出匹配到的最后一个。

/[\S]+$/
查找结尾处非空白字符

推荐个学习正则的网站
https://www.debuggex.com/

不要直接加 name ,换成 username/xxx , xxx 就是动态的 name

location /echo {
set $user '';
if ($http_user_agent ~ (?\S+)$ ) {
set $user "$user";
}
return 200 $user;
}

下面代码,已测试通过。:)
if ($http_user_agent ~* "\b(?'baobao'\S\w+$)") {
set $user "$baobao";
}

再测试一遍。成功, LZ 可以测试下
if ($http_user_agent ~* "\b(?'baobao'\S\w+)$") {
set $user "$baobao";
}

楼主你这个需求强烈建议用 map 指令,不要用 if

if 会降低性能并导致各种奇奇怪怪的问题
用 map

map 形式怎么写
```
map $http_user_agent $user {
default '';
~curl curl;
~[\S]+$ $user;
}
```
这样只能匹配 curl ,用浏览器就直接 nginx 挂了

我这样写,通过浏览器进来的就直接挂了,但 curl 方式是 OK 的,[alert] 804worker process 5083 exited on signal 11

找到解决方法了,对 nginx 不太熟悉,现在 OK 了

数据地带为您的网站提供全球顶级IDC资源
在线咨询
专属客服