|
|
哎,你们发现没?最近AI圈和内容平台之间那点事儿,真是越来越有看头了。这不,Reddit、Yahoo、Quora,还有那个超实用的wikiHow,居然坐到了一张桌子上,联手搞了个新标准RSL——说白了,就是要一起向AI公司“讨个说法”:你们老拿我们的内容去训练模型,是不是该表示表示?
以前网站都是用robots.txt文件来告诉爬虫哪些可以抓、哪些不能抓,不过现在不一样了。RSL等于是给robots.txt加了个"付费开关"——网站不仅可以拒绝抓取,还能随时灵活定价:"按爬一次付一次"、"按模型调用量分成",甚至推出"包月包年套餐"。是不是瞬间觉得内容网站变身高档知识超市了?
推动这个标准的都是业内重量级人物。牵头的是RSS标准的联合创始人Eckart Walther,还有前Ask.com的母公司IAC(InterActiveCorp)旗下出版业务CEO Doug Leeds。他们说,这么做不是为了"拦着AI发展",而是想搭建一个"可持续的内容生态"。用他们的话来讲:"AI可以学,但不能白学。"
目前已经有不少大厂加入了这个联盟,比如IGN背后的Ziff Davis、技术圈熟悉的O'Reilly,还有写作业、做方案时不少人都常用的wikiHow。这阵容,堪称内容界的"权益保卫战联盟"。
可问题是:AI公司会愿意乖乖掏钱吗?
虽然OpenAI、亚马逊这些科技巨头之前已经和少数媒体大厂(比如新闻集团、纽约时报、《The Verge》的母公司Vox Media等)签了一些私下协议,然鹅那终究只是"大佬们的游戏"。RSL的野心,是让每一个个人站长、独立博主,甚至普通创作者,也能因为AI用了自己的内容而获得回报。
不过理想很丰满,现实却可能有点"曲折"。目前RSL本身并不能直接拦住AI爬虫,得依赖合作伙伴Fastly(一家CDN服务商)来做"门口检查员"——识别哪些AI机器人已付费、哪些还在"自由学习"。Leeds对此打了个比方:Fastly就像是俱乐部门口的保安,RSL则是发会员卡的系统。没卡?那可能就进不来了。他还特别强调:"如果你不遵守许可条款,就等于是同时侵犯了所有参与者的权益"。
而就算有了卡,具体执行也仍然复杂。AI训练所使用的版权内容到底怎么计价?"按推理次数付费"听起来很先进,可如果AI公司不配合回传数据,这账根本算不清。更何况,眼下不少AI公司自己也正陷入侵权纠纷,比如Getty Images、Reddit以及多家出版社发起的一系列诉讼。
Leeds和Walther也强调,推出RSL还有一个重要目的:解决所谓"隐形协议"问题——很多爬虫根本不曾真正阅读条款就抓取了内容,而RSL则要求它们必须在访问之前先看清楚许可条件。
尽管挑战不少,这批内容持有者(原创者)显然不愿坐等被"白嫖"。"音乐、影视行业都有成熟的版权机制,比如音乐版权组织ASCAP就是很好的例子,为什么Web内容就要一直被免费使用?"Leeds说,"我们不是在发明新规则,我们只是把合理付费的机制,引入AI训练这个领域。"
目前加入RSL集体是完全免费的,这也吸引了不少中小创作者关注。说不定不久的将来,你随手发的帖子、专栏文章或视频,也能因为被AI"学了"而带来意想不到的收入呢?
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|