刚刚,Cloudflare宣战AI爬虫:默认封杀,按次收费!


刚刚,Cloudflare宣战AI爬虫:默认封杀,按次收费!

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

AIAgent背后的爬虫们,终于踢到铁板了!
互联网基础设施巨头Cloudflare今天宣布,将默认屏蔽所有AI爬虫访问其托管的网站。
这不是简单的技术调整,而是对整个AI产业的一记重拳。
Cloudflare不仅要封杀,还推出了一套完整的解决方案:客户可以手动允许或禁止特定的AI爬虫,更重要的是,推出了「按次付费爬取」服务——AI公司想要网站数据?
可以,掏钱!
网络爬虫这个东西,原本是搜索引擎的专属工具。它们在互联网上漫游,消化和编目每个网站的在线信息。
但现在,开发者们用它来收集构建AI系统所需的数据。
问题在于:AI系统不像搜索引擎那样提供同等的变现机会和信用认可。
Cloudflare的AI隐私、控制和媒体产品负责人WillAllen在邮件中写道:
「传统上,大家心照不宣的协议是:搜索引擎可以索引你的内容,然后它们会显示相关链接并给你的网站带来流量。但这种模式正在发生根本性改变。」
AI模型从网络上提取大量数据来生成输出,但这些数据源往往得不到认可,限制了创作者从自己的作品中赚钱的能力。
即使是那些包含AI生成答案的搜索引擎,虽然可能会包含原始来源的链接,但也可能减少人们点击其他网站的兴趣,甚至可能迎来一个「零点击」的未来。
Cloudflare这次是认真的,推出了三大举措:
精准控制权:客户现在可以针对AI生命周期的每个阶段(训练、微调和推理)分别允许或禁止爬取,还可以将特定的已验证爬虫列入白名单。
明码标价:客户可以设定AI爬虫爬取其网站的费率。想要数据?按次付费!
技术封杀:对于那些不守规矩的爬虫,Cloudflare准备动用其对抗DDoS攻击的经验来阻止它们。
在Cloudflare的新闻稿中,美联社、时代杂志等媒体公司,以及Quora、StackOverflow等论坛都表达了支持。
StackOverflow的CEOPrashanthChandrasekar在声明中说:
「为大语言模型提供燃料的社区平台应该因其贡献而获得补偿,这样它们才能重新投资于自己的社区。」
这话说得很直白:你用我的数据训练AI,就得付钱。
爬虫本应遵守网站通过robots. txt文件提供的指令,但一些AI公司被指控无视这些指令。
Cloudflare已经有一个机器人验证系统,AI网络爬虫可以告诉网站它们为谁工作以及想要做什么。对于诚实的爬虫,Cloudflare希望其系统能促进AI公司和网站所有者之间的善意谈判。
Allen写道:
「在互联网上寻找最新内容的网络爬虫只是另一种类型的机器人——所以我们在处理明显恶意机器人方面的所有工作,都有助于我们理解爬虫在做什么。」
对于真正的坏家伙,Cloudflare还有更狠的招数:让网站向它们发送AI生成的虚假网页,让它们白费力气。
但公司表示,希望新服务能够促进AI公司和内容生产者之间建立更好的关系。
看到这里,我的感受是:天下没有免费的午餐。
过去二十年,互联网建立在一个默契之上:内容免费,流量变现。
搜索引擎爬取内容,带来访客;网站提供信息,获得广告收入。
但AI打破了这个平衡。
它像一个巨大的吸尘器,把互联网上的所有内容都吸进去,然后吐出一个个看似无所不知的答案。用户得到了答案,却不再需要访问原始网站。
这是一种新形式的「数字殖民」。
Cloudflare的举动,本质上是在重新定义互联网的游戏规则。当基础设施提供商开始介入内容分发的博弈,整个生态系统都将被重塑。
但这也带来了新的问题:
当每一次数据爬取都需要付费,小型AI创业公司还能活下去吗?
当内容被层层设防,开放的互联网精神还能延续吗?
或许,这正是互联网从「信息自由流动」走向「数据精准定价」的转折点。
在这个转折点上,Cloudflare选择了站在内容创作者这一边。
因为他们知道:没有优质内容的互联网,就像没有水的河流。
[1]Cloudflarewillnow,bydefault,blockAIbots:https ://www. technologyreview.com/author/peter-hall/
👇
👇
👇
另外,我还用AI进行了全网的AI资讯采集,并用AI进行挑选、审核、翻译、总结后发布到《AGIHunt》的实时AI快讯群中。
这是个只有信息、没有感情的AI资讯信息流(不是推荐流、不卖课、不讲道理、不教你做人、只提供信息、希望能为你节省一些时间)
欢迎加入!
也欢迎加群和2000+群友交流。


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录