技术解析

nginx 访问日志里为何会有其他网站的?
0
2021-05-25 11:56:54
idczone

91.196.50.33 - - [28/Aug/2016:13:30:18 +0800] "GET http://testp4.pospr.waw.pl/testproxy.php HTTP/1.1" 404 3650 "-" "Mozilla/5.0 (Windows NT 5.1; rv:32.0) Gecko/20100101 Firefox/31.0" "-" 185.25.148.240 - - [28/Aug/2016:13:31:04 +0800] "GET http://testp4.pospr.waw.pl/testproxy.php HTTP/1.1" 404 3650 "-" "Mozilla/5.0 (Windows NT 5.1; r抗投诉服务器v:32.0) Gecko/20100101 Firefox/31.0" "-" 80.82.78.38 - - [28/Aug/2016:14:44:12 +0800] "GET http://www.baidu.com/cache/global/img/gs.gif HTTP/1.1" 404 3650 "-" "Mozilla" "-"

我有个阿里云 装了 nginx 之后一直开着 80 端口,使用默认配置。也没运行什么服务。昨天看了下访问日志,为何会有访问这些网站的记录被捕获到?


扫代理的

被扫了

http proxy 的报文就是这样子的。

看了前面的明白了,他是向你机器发送 get 其他网站的请求,如果你这个机器是代理,就能返回真的其他网站的 html,

这是怎么实现的??又没人普及下,我不懂啊

我说的不清楚么。。。你要有兴趣就看看这个文件吧 https://github.com/senko/tornado-proxy/blob/master/tornado_proxy/proxy.py
如果你熟悉 HTTP 协议,会点 python 看完这个 mini 的 http proxy 实现就知道了。
再伸手就不合适了。

对于一台代理服务器而言,服务器收到的请求就是 GET http://example.com
代理服务器应该以 client 的角色去抓取这个 URL 并返回给客户端

我懂了

最近在学习 python ,这个看着还是比较吃力

数据地带为您的网站提供全球顶级IDC资源
在线咨询
专属客服