美国法院放行AI版权训练，原创者迎来凛冬时刻

麻薯滑芝士 · 发表于 2025-6-25 09:07:52

创作者朋友们，一条上周二来自美国加州北区联邦地区法院的裁决，让整个内容行业心头一紧。裁决重点翻译成人话就是：法官说了，用受版权保护的作品训练人工智能(AI)模型，这事合法！对于已经被困扰多年的创意工作者来说，这无异于当头一棒。

这些年，内容创作者的日子可真不好过。一大槽点就是，很多AI公司招呼都不打，就“光明正大”地把他们的网站内容从头到尾扫个遍，甚至整本整本地扫描书籍，只为喂养自家那些“嗷嗷待哺”的大型语言模型（LLMs）。创作者们耗尽心血打磨的作品，就这么成了别人家的免费AI饲料。更扎心的是，这些“吃进去”的数据，转眼就变成生成式AI或其他赚钱机器学习的养料，最终让那些“薅羊毛”的公司赚得盆满钵满，原作者和内容源却连个钢镚儿都没见到。

上周二的这份裁决，基本等于给各大公司亮绿灯：甭管啥公开的媒体内容，只要想用来训练AI，尽管拿去用吧！

这场官司的起源，是作家安德莉亚·巴茨 (Andrea Bartz)、查尔斯·格雷伯 (Charles Graeber) 和柯克·华莱士·约翰逊 (Kirk Wallace Johnson) 联手告了AI公司Anthropic。案子早在去年2024年就开始了。作家们揪着一点不放：Anthropic用了盗版材料训练它家的Claude AI模型。其中一个实锤是，Anthropic直接把实体印刷书做成了数字拷贝，专门拿来喂AI模型。

做出最终裁定的威廉·阿尔苏普 (William Alsup) 法官，常看《AppleInsider》的朋友可能对他挺面熟。这次的判决书内容有点复杂，双方在部分点上各有胜负。但整份裁决的“风向标”作用明摆着，是站到了Anthropic和那些搞数据爬取(Scraping)的AI公司这一边。

阿尔苏普法官的核心观点讲得很直白：为了训练特定LLMs而使用作品副本，在法律上属于“合理使用”(Fair Use)，没啥问题。他本人还特别强调了一句：“本案涉及的技术，是我们许多人这辈子见过的、最具变革性的技术之一。”

判决书还认为，把实体印刷书库整个转成数字书库的操作，也符合合理使用。更关键的是，用这些数字内容去训练LLMs，同样算是合理使用。法官甚至打了个比方，觉得作者们的控诉，就好比有人反对用书籍去教小学生写好作文。不过，这理由就有点站不住脚了——AI模型在法律上可跟“小学生”扯不上半毛钱关系嘛。

在这个逻辑下，阿尔苏普法官裁定，《版权法》的本意是鼓励创作更多原创作品，而不是“给作者当盔甲，帮他们挡住所有竞争”。

原告方唯一占到点便宜的，是关于盗版材料的使用问题。法庭明确指出：即使一本盗版数字书没真正用来训练模型，单是建个这种盗版书库的行为，也不在合理使用范围内。更绝的是，哪怕Anthropic先把书盗版了，之后再买本正版的“事后补救”，法庭也认为这招洗不白之前的非法行为。

关于盗版问题的具体指控，法院后面还会专门开个听证会，来决定Anthropic到底该赔多少钱。

内容创作者的寒冬来临

这个判决对艺术家、音乐人、作家而言，简直就是坏消息开大会。其他那些担心被AI抢饭碗的行当，比如某些自称“上过编程课就懂科技”的法官（此处指裁决法官自己的类比），估计心里也得打鼓。

说白了，AI模型是踩着内容创作者耗费心血、融入人生阅历的作品爬上去的，结果这些成果被打包进模型的知识库，然后被包装成AI的原创输出。令人绝望的是，面对这股洪流，原创者们手上能用的招数真没几个。

眼下明摆着，这个判决必定会成为日后AI领域版权官司的标杆案例，特别是在处理那些原创作品被“生吞活剥”用于模型训练的问题上。

多年来，AI公司为了“喂养”那些数据黑洞般的LLMs，到处“扒粮”的行为早就被骂惨了，尤其那些未经许可直接从网上爬数据的手段。

这事带来的负面影响是一连串的。最显眼的就是生成式AI：模型被训练得能模仿特定艺术风格“搞创作”，直接让正牌艺术家的作品掉了价。反击的子弹也打出去了，比如今年六月初曝光的迪士尼和环球影业联手起诉Midjourney的大案。这家做AI图像生成的公司，被指控干了一票大的——直接拿这两家娱乐巨头旗下最具标志性的角色图片当模型饲料，涉嫌大规模侵犯版权。

迪士尼和环球在起诉书上用了极其严厉的措辞，痛斥Midjourney是一个“靠盗用受保护内容堆砌出来的抄袭无底洞”。想想看，这两家平日里打得火热的死对头，这次居然能放下恩怨联手出击，事情的严重程度可想而知。

像《AppleInsider》这样的网站和出版商，同样被这个新问题搞得焦头烂额。用户现在查资料，用不着再辛辛苦苦开搜索引擎点链接了，直接张嘴找AI模型要份定制摘要就完事。至于那些提供原始内容的网站？根本没人想点进去。更要命的是，AI“东拼西凑”吐出来的答案经常出错，还把不同来源的信息胡乱掺和，导致原始信息的意思完全走样。我们自己就亲历过：辛辛苦苦写的操作指南被AI原封不动“扒走”，再跟其他网站上错误百出的步骤混在一起，拼凑出一个根本没法用的流程，气得人直跺脚。

出版商们看着流量哗哗掉，收入跟着跳水，补偿的问题却至今悬而未决。当然也有公司在努力寻求更合规的方式，苹果算其中之一。据报道，苹果为训练自家的生成式AI，曾开价数百万美元给新闻出版商谈内容授权。它还掏钱跟图库网站Shutterstock买了版权，就是为了打造用在Apple Intelligence功能上的图像模型。

不少大型出版商也没坐以待毙，搬出了技术手段——在网站通过robots.txt文件设置障碍，拒绝AI公司的数据爬虫访问内容存档。不过这招也就是个“君子协议”，只能拦住讲规矩的数据搜集者，碰上那些不管不顾硬要扒内容的，它就形同虚设。更要命的是，被无休止地爬取网站数据，服务器承受的运算压力和带宽消耗全是实打实的成本——这笔账，最终都转嫁到被爬的网站自己头上了。

这个判决出炉前还有个小插曲：最近有风声传出，美国多家科技巨头正卯足了劲儿游说政府，想让美国各州在未来十年里都别对AI领域下刀子、立新规。

大西洋彼岸的欧盟也在折腾，想让科技公司们签个叫“AI公约”（AI Pact）的玩意儿，承诺安全开发AI。不过眼尖的人发现，无论美国那边还是欧盟这边，苹果似乎都兴趣缺缺，没参与进去。

liqh · 发表于 2025-6-25 09:36:41

这样能促进快速发展

账号		自动登录	找回密码
密码			立即注册

[业界] 美国法院放行AI版权训练，原创者迎来凛冬时刻

本帖子中包含更多资源

相关帖子

浏览过的版块

[业界] 美国​​法院放行AI版权训练，原创者迎来凛冬时刻​

本帖子中包含更多资源

相关帖子

浏览过的版块

[业界] 美国法院放行AI版权训练，原创者迎来凛冬时刻