CSDN 问答会采集 GitHub 的 issues
- 0次
- 2021-06-01 16:59:48
- idczone
原页面: https://github.com/wang-bin/QtAV/issues/1327
采集页面: https://ask.csdn.net/question大带宽服务器s/6433237
见怪不怪
还真就是那个一模一样了,太离谱了。之前还见到过那种爬取 Stack Overflow 上的问题然后通过机翻转成中文的网站
stackoom
不用之前,就是现在,太常见了
经常搜到,十分恶心
不针对 CSDN,前几年流行采集 stackoverflow,然后机翻,这两年见的少了,估计没收入也没人看,所以不干了。
csdn,最恶心的网站了,已经通过油猴屏蔽了谷歌结果的 csdn 。
同经常遇到。还有个网站记不清叫什么,全文机翻 stackoverflow 的帖子
网站好像叫程序员堆栈溢出哈哈哈
现在还在吗?当时我给 sof 发过采集站的事情,因为 soom 没有遵循 cc by 协议,sof 说他们会尽可能处理。
我用 google 经常搜到这种,贼恶心。中文互联网真的被这种垃圾信息污染了
直接把这个垃圾网站屏蔽了
见过从 Stack Overflow 爬过来机翻的,但是不知道是不是 CSDN 干的,因为在不同的网站上都见到过,可能有人转载了。。。
甚至有,问题没有人回答的,也被爬过来了。。
主要有两个原因,1. 中文广告单价和点击率都很低,技术类广告也就腾讯云华为云那几家广告主,而这两个金主爸爸也很少投放了,不过收益覆盖成本还是没问题的,但没啥意思; 2. 最重要的是大部分站是被谷歌 K 掉了。
搜一些比较偏的报错信息就会发现,中英文技术问答都很多这类采集站
现在基本都是用 Google 搜英文了,google 的中文结果真的一言难尽
it 界 kknews
一搜东西全是这傻逼网站的内容,还没一篇是有用的
CSDN=内容农场
容我说一句,现在 CSdn 就是垃圾中的战斗机,eco 更是
几个月前发现过,搞笑的是还假模假样地建了一堆机器人帐号冒充真人,而这些帐号名下还有一堆“原创”文章。
中文搜索真的越来越不行了,用的 google,前几页几乎全是内容农场,什么采茶网信息网简笔画网,太恶心人了。
推荐一个插件 https://github.com/cobaltdisco/Google-Chinese-Results-Blocklist
以前 csdn 的下载还勉强有点用,现在改成了每个资源都几乎要 50 分,拜拜了,肉眼避开 csdn 和相关站点结果
秀下限的东西,阿里云腾讯云都很多这种东西,不过阿里云和腾讯云的可以完全忽略就好,因为没有任何参考价值,人也不指望你去理解它,只是引流而已,但像 csdn 就是靠内容吸引用户的,把自己的有价值的东西淹没,损坏自己的招牌。浪费别人的时间也不利己
这个真的很常见,我已经慢慢习惯直接用英文搜索了
见怪不怪了,经常都能搜到这些扒过来机翻的网站
那几家云不都搞了个社区,前面都是采集 stackoverflow 的
现在更过分,比如你搜个"Invalid prop `value`",他按照这个关键词给你弄个标题,点进去文章是空的,引流别的东西
CSDN 赶紧倒闭吧
最神奇的是还假装生成用户名,全部以 weixin_开头,吃相太难看,这种垃圾网站就是技术界的耻辱
我还以为就我遇到这种空壳网站了,也不知道它的意义是什么,原来是引流啊
良心云、套路云官网社区模块(大概是这个,搜索经常不小心搜到) 也在疯狂采集第三方问答、文档 恶心的一批
太恶心了,来源都不放
很早就发现了,还有全英文的,当时就好奇,老外还用 csdn 啊?回复还挺多...
到处都是采集站,很恶心。
可以用 uBlacklist 插件屏蔽掉,不过记得将 Google 的`每页搜索结果数`设置多一点,不然搜索某些关键字时,屏蔽后,就剩不下几个结果了。
采集站真是难搞,搞笑的还有机翻的。