就发布.png

2024-08-22 微信搜索 热度:711
防止内容被抓取训练AI:百度百科屏蔽谷歌/必应等搜索引擎

快科技8月22日消息,据报道,近日百度百科开始屏蔽谷歌和必应等大多数搜索引擎,预计是为了阻止这些搜索引擎和其他爬虫,未经授权抓取百度百科的内容用于训练AI。

百度百科的robots.txt文件显示,目前仅有百度搜索、搜狗搜索、中国搜索(Chinaso)、YYSpider和宜搜搜索(EasouSpider)等少数几个搜索引擎被允许抓取其内容。

谷歌搜索、必应搜索、微软MSN、UC浏览器的Yisouspider以及其他一切搜索引擎爬虫均被明确禁止抓取百度百科的内容。

虽然360搜索没有在封禁列表中单独列出,但百度百科的策略是禁止一切非白名单爬虫抓取,所以360搜索和其他搜索引擎也都是被屏蔽的。

不过百度百科这种做法其实也只是防君子不防小人,肯定还有很多爬虫通过各种方式继续抓取内容然后拿去训练AI。

上一篇:小米卖一辆车亏6万多 雷军回应:小米汽车还在投入期

下一篇:小米:第二季度汽车业务收入64亿元 冲刺全年交付12万辆SU7目标

赞 0
分享
最新动态

前高管控「做假帐几十亿」 360市值蒸发40亿 周鸿祎:诋毁

王毅:日本曾以「存亡危机事态」为幌子发动侵略 绝不能重演

中共中央财办:扩大内需是中国2026排首位重点任务

中国宣布对欧盟猪肉徵收反倾销税 期限达5年

中国民众「走线」美国无门 改走欧洲目标德国

台湾与宏都拉斯有望恢复邦交?北京呛:金元外交注定失败

李家超述职 习近平强调贯彻「一国两制」关注宏福苑大火

中美AI竞争加速 未来3年中国晶片技术或弯道超车

泰缴获柬武器 网友认出:中製反坦克导弹 1枚10万美元

全裸做SPA被安排男技师 长沙女拒绝…被酸「孤陋寡闻」

账号登录,或者注册个账号?