技术解析

现在爬虫是越来越难做了嗷
0
1975-02-23 06:23:54
idczone

中午接到一个关于 ETC 的诈骗个人信息的网站,刚刚用电脑试了一下,结果发现这破网站数据没做验证、域名今天刚刚注册、ASP 网站

这我就来劲了啊,当即我就找了以前注册过的某个提供代理 IP 的网站,以前还可以每天免费直接提取 20 个 IP,塞假数据够用了

结果今天刚一登录想领取,就发现领取 IP 需要实名认证抗投诉服务器了...

起初我还以为仅仅是这个网站需要,然后我就去找了另两家,注册了账号后发现,还是需要实名认证...

我本身不做爬虫,也很久没登录过这网站了,发这帖子也只是想打两行字而已

说实话,要实名也已经拿到手机号了还要身份证...我主要还是信不过这些提供代理 IP 的公司,为啥阿里云没有提供代理 IP 咧(难道要开台 ECS ?那我还是放弃吧:(


爬虫容易坐牢.

代理 ip 除了爬虫还有其他场景需要么?

爬虫搞得好.要么一辈子衣食无忧,要么一辈子衣食无忧.

http/https/sock 类型的代理是不好找了,可是别的类型的,公开的倒是还挺多的,缺点是没有中国大陆 ip 的

爬虫是灰色地带,不要做违法犯罪的事儿。
手机号虽然是已实名,但是手机号冒用或者假身份注册的太严重了...

本人爬虫,现已失业

不是难做,而是易坐

因为用代理 ip 绕过服务器反爬虫是属于违法的, 前段时间看过一个因此判刑的案例
案例里除了代理 ip, 还使用了打码平台, 对接打码平台绕过反爬虫也属于违法的
很久以前还看到过使用自定义 UA 的被判的案例
太难了


"代理 ip 绕过服务器反爬虫是属于违法""因此判刑",那这些公司不就是"提供侵入、非法控制计算机信息系统程序、工具罪"了嘛.....
注册的用户只要领取过 IP 就是潜在的可以判刑的人员.......
想想就受不了

我想到了菜刀


"注册的用户只要领取过 IP 就是潜在的可以判刑的人员......."
还好吧, 收敛点, 别爬体量大的公司, 别给人家造成损失, 人家可能都发现不了...
你喂数据给诈骗网站不需要用代理 ip 吧, 它又不受法律保护, 你给他炸了都没事

非法入侵计算机系统罪,在法律还不完善的情况下,当做口袋罪判也不是不可能

代理 IP 自建比较好,用拨号 vps,10 台可切成千上万个 ip,多妥的

现在对知识的保护越来越强了,很多商业公司有价值的东西,比如,电商网站数据,点评网站评论数据等都是有专门的团队了做反爬虫,而绝大部分的爬虫基本不会配个专业团队来做吧。而 ZF 这些公开的数据大学实习生就能爬了,有没有经验都无所谓,当时我也是爬虫找到第一份工作,但是半年之后就转到数据分析,然后转到大数据方向了。感觉爬虫的前景我是不太看好

是啊,爬虫太难了

爬虫是离吃牢饭最近的一步了

做爬虫,爬的慢没事,做飞虫就可以吃国家粮了 /。

数据地带为您的网站提供全球顶级IDC资源
在线咨询
专属客服