数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 185|回复: 1

[业界] 美国​​法院放行AI版权训练,原创者迎来凛冬时刻​

[复制链接]
发表于 2025-6-25 09:07:52 | 显示全部楼层 |阅读模式
创作者朋友们,一条上周二来自美国加州北区联邦地区法院的裁决,让整个内容行业心头一紧。裁决重点​​翻译成人话就是:法官说了,用受版权保护的作品训练人工智能(AI)模型,这事合法!对于已经被困扰多年的创意工作者来说,这无异于当头一棒。

这些年,内容创作者的日子可真不好过。一大槽点就是,很多AI公司招呼都不打,就“光明正大”地把他们的网站内容从头到尾扫个遍,甚至整本整本地扫描书籍,只为喂养自家那些“嗷嗷待哺”的大型语言模型(LLMs)。创作者们耗尽心血打磨的作品,就这么成了别人家的免费AI饲料。更扎心的是,这些“吃进去”的数据,转眼就变成生成式AI或其他赚钱机器学习的养料,最终让那些“薅羊毛”的公司赚得盆满钵满,原作者和内容源却连个钢镚儿都没见到。

上周二的这份裁决,基本等于给各大公司亮绿灯:甭管啥公开的媒体内容,只要想用来训练AI,尽管拿去用吧!

这场官司的起源,是作家安德莉亚·巴茨 (Andrea Bartz)、查尔斯·格雷伯 (Charles Graeber) 和柯克·华莱士·约翰逊 (Kirk Wallace Johnson) 联手告了AI公司Anthropic。案子早在去年2024年就开始了。作家们揪着一点不放:Anthropic用了盗版材料训练它家的Claude AI模型。其中一个实锤是,Anthropic直接把实体印刷书做成了数字拷贝,专门拿来喂AI模型。

做出最终裁定的威廉·阿尔苏普 (William Alsup) 法官,常看《AppleInsider》的朋友可能对他挺面熟。这次的判决书内容有点复杂,双方在部分点上各有胜负。但整份裁决的“风向标”作用明摆着,是站到了Anthropic和那些搞数据爬取(Scraping)的AI公司这一边。

阿尔苏普法官的核心观点讲得很直白:为了训练特定LLMs而使用作品副本,在法律上属于“合理使用”(Fair Use),没啥问题。他本人还特别强调了一句:“本案涉及的技术,是我们许多人这辈子见过的、最具变革性的技术之一。”

判决书还认为,把实体印刷书库整个转成数字书库的操作,也符合合理使用。更关键的是,用这些数字内容去训练LLMs,同样算是合理使用。法官甚至打了个比方,觉得作者们的控诉,就好比有人反对用书籍去教小学生写好作文。不过,这理由就有点站不住脚了——AI模型在法律上可跟“小学生”扯不上半毛钱关系嘛。

在这个逻辑下,阿尔苏普法官裁定,《版权法》的本意是鼓励创作更多原创作品,而不是“给作者当盔甲,帮他们挡住所有竞争”。

原告方唯一占到点便宜的,是关于盗版材料的使用问题。法庭明确指出:即使一本盗版数字书没真正用来训练模型,单是建个这种盗版书库的行为,也不在合理使用范围内。更绝的是,哪怕Anthropic先把书盗版了,之后再买本正版的“事后补救”,法庭也认为这招洗不白之前的非法行为。

关于盗版问题的具体指控,法院后面还会专门开个听证会,来决定Anthropic到底该赔多少钱。

​​内容创作者的寒冬来临​​

这个判决对艺术家、音乐人、作家而言,简直就是坏消息开大会。其他那些担心被AI抢饭碗的行当,比如某些自称“上过编程课就懂科技”的法官(此处指裁决法官自己的类比),估计心里也得打鼓。

说白了,AI模型是踩着内容创作者耗费心血、融入人生阅历的作品爬上去的,结果这些成果被打包进模型的知识库,然后被包装成AI的原创输出。令人绝望的是,面对这股洪流,原创者们手上能用的招数真没几个。

眼下明摆着,这个判决必定会成为日后AI领域版权官司的标杆案例,特别是在处理那些原创作品被“生吞活剥”用于模型训练的问题上。

多年来,AI公司为了“喂养”那些数据黑洞般的LLMs,到处“扒粮”的行为早就被骂惨了,尤其那些未经许可直接从网上爬数据的手段。

这事带来的负面影响是一连串的。最显眼的就是生成式AI:模型被训练得能模仿特定艺术风格“搞创作”,直接让正牌艺术家的作品掉了价。反击的子弹也打出去了,比如今年六月初曝光的迪士尼和环球影业联手起诉Midjourney的大案。这家做AI图像生成的公司,被指控干了一票大的——直接拿这两家娱乐巨头旗下最具标志性的角色图片当模型饲料,涉嫌大规模侵犯版权。

迪士尼和环球在起诉书上用了极其严厉的措辞,痛斥Midjourney是一个“靠盗用受保护内容堆砌出来的抄袭无底洞”。想想看,这两家平日里打得火热的死对头,这次居然能放下恩怨联手出击,事情的严重程度可想而知。

像《AppleInsider》这样的网站和出版商,同样被这个新问题搞得焦头烂额。用户现在查资料,用不着再辛辛苦苦开搜索引擎点链接了,直接张嘴找AI模型要份定制摘要就完事。至于那些提供原始内容的网站?根本没人想点进去。更要命的是,AI“东拼西凑”吐出来的答案经常出错,还把不同来源的信息胡乱掺和,导致原始信息的意思完全走样。我们自己就亲历过:辛辛苦苦写的操作指南被AI原封不动“扒走”,再跟其他网站上错误百出的步骤混在一起,拼凑出一个根本没法用的流程,气得人直跺脚。

出版商们看着流量哗哗掉,收入跟着跳水,补偿的问题却至今悬而未决。当然也有公司在努力寻求更合规的方式,苹果算其中之一。据报道,苹果为训练自家的生成式AI,曾开价数百万美元给新闻出版商谈内容授权。它还掏钱跟图库网站Shutterstock买了版权,就是为了打造用在Apple Intelligence功能上的图像模型。

不少大型出版商也没坐以待毙,搬出了技术手段——在网站通过robots.txt文件设置障碍,拒绝AI公司的数据爬虫访问内容存档。不过这招也就是个“君子协议”,只能拦住讲规矩的数据搜集者,碰上那些不管不顾硬要扒内容的,它就形同虚设。更要命的是,被无休止地爬取网站数据,服务器承受的运算压力和带宽消耗全是实打实的成本——这笔账,最终都转嫁到被爬的网站自己头上了。

这个判决出炉前还有个小插曲:最近有风声传出,美国多家科技巨头正卯足了劲儿游说政府,想让美国各州在未来十年里都别对AI领域下刀子、立新规。

大西洋彼岸的欧盟也在折腾,想让科技公司们签个叫“AI公约”(AI Pact)的玩意儿,承诺安全开发AI。不过眼尖的人发现,无论美国那边还是欧盟这边,苹果似乎都兴趣缺缺,没参与进去。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
发表于 2025-6-25 09:36:41 | 显示全部楼层
这样能促进快速发展
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-7-22 05:13 , Processed in 0.140400 second(s), 9 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表