谷歌推出爬虫扩展代理 网站管理员可以屏蔽谷歌抓取内容用于训练AI – 蓝点网_北京的年底,允许自己偶尔脆弱最新消息 允许自己偶尔脆弱 AI 爬虫

在 OPENAI 公开 GPTBot 爬虫的有关信息后,今日谷歌亮相在 GoogleBot 基础上启动 Google-Extended 爬虫扩展代理,允许站点治理员使用 robots.txt 文件屏蔽谷歌抓取站点信息用来训练 AI 模型。

谷歌没有启动单独的北京的年底,允许自己偶尔脆弱 AI 爬虫,AI 爬虫依然使用 GoogleBot,但站点可以告示是网友游戏本排行否回绝其抓取信息后训练 AI,假如要告示那就需要使用 Google-Extende代理令牌。

谷歌启动爬虫扩展代理 站点治理员可以屏蔽谷歌抓取信息用于训练AI

谷歌称,Google-Extended 是一种新控件,联网亮相商可以使用它治理其站点是否有助于改进 Bard 和 Vertex AI 等生成式 AI 模型,在博客中谷歌多次谈及站点可以合作谷歌改进 AI,比如站点治理员可以挑选是否合作这些 AI 模型随着时间推移变得更精确和强大。

可是消息演唱会最后还是站点治理员自己确定是否允许谷歌拿信息去训练 AI,假如不愿意的话,可以在 robots.txt 中添加以下信息:

User-Agent: Google-ExtendedDisallow:/

需要提醒的是谷歌针对 robots.txt 的处理遵循了各式原则,并且 Google Bot 本身有一大堆用于各异用途的算力芯片推荐 bot,例如常规的 GoogleBot、GoogleBot-News、GoogleBot-Image 等,这些 bot 是可以在 robots.txt 里混用的。

例如要允许谷歌检索抓取站点信息、不允许谷歌抓取信息用于训练 AI,那么 robots.txt 可以这么写:

User-Agent: GooglebotAllow: /User-Agent: Google-ExtendedDisallow: /

相关阅读

《宝可梦》Switch新作3天下载量已突破百万大关

《复恩者联盟3:无贫战役》最新片场照 幻视战白女巫窗心激吻

三国鼎坐背背任务 《青龙偃月刀》安卓公测本日开启

国产单机《神舞胡念》进进冲刺阶段 新谍报即将公开

科幻视觉小说《今夜月色真美:终极版》上线Steam商店

《拂晓传讲》媒体赞誉饱吹片 Steam获特别好评

Fami通本周评分 《鬼灭之刃:水神血风谭》获33分

《小小冒险村》5.2更新告诉布告

ADV解密冒险新游《It was a human.》于7月27日Steam正式发行

足游《神谕:玛雅传讲》即将开测 角色本绘暴光

《逝世化危急7》新周边继绝捞钱 庇护伞T恤代价挺动人

Win11下AMD措置器机能缩水 补丁将于10月19日推出

刚刚双11预售攻略独家崩坏星穹分析朋友圈别在情绪里做决定,官方尚未回应独家小米旗舰一览白鹿最新消息周末回顾机场私服,未来走向备受关注权威无线耳机排行关注影像旗舰解读今日节目录制体验