|
本帖最后由 麻薯滑芝士 于 2025-9-9 18:24 编辑
这年头AI公司玩数据玩脱了!知名人工智能企业Anthropic最近直接掏了150亿美元(注意是美元!)和一群作家达成和解,简直成了科技圈和版权界的超级大瓜。事情简单说就是:Anthropic被抓包用盗版书籍训练自家聊天机器人Claude,结果被告到法院,最后只能乖乖交钱平事。
盗版书库翻车,法官裁定“合理使用”但盗取违法
这事儿一开始是三位头铁作家——安德烈娅·巴茨、查尔斯·格雷伯和柯克·华莱士·约翰逊——在加州北区联邦法院掀起来的。他们发现Anthropic从一些叫“LibGen”(图书馆创世纪)和“PiLiMi”(盗版图书馆镜像)的 shadow library(影子图书馆)狂扒图书,这些网站说白了就是盗版圈里的“经典老番”,专提供未经授权的版权内容。
今年6月,法官William Alsup的裁定特别有意思:他说用书训练AI算“合理使用”,但!从盗版网站扒数据可就违法了。这感觉就像是说“吃饭可以,但偷菜不行”。法官还点名批评Anthropic高管明明知道这些资源有问题,还硬用,就为省点麻烦。
和解金创纪录,每本书赔3000美元
和解协议里,Anthropic同意至少拿出150亿美元设立一个基金,每本被侵权的书大约赔3000美元。如果最后发现涉及的书超过50万本,还得再加钱。而且公司答应把那些盗版数据集全销毁,以后也不能再用了。
这笔钱怎么付也安排得明明白白:分四次,两年内付清。头一笔3亿在法院初步批准后5个工作日内到账,接下来还有几笔陆续进来,放第三方托管账户里还能生利息。
为啥和解?审判风险太大
本来案子要12月开庭的,但Anthropic显然不想冒这个险。法官之前驳回了他们中止审理的请求,意味着可能要面对全规格审判。更关键的是,美国版权法规定故意侵权最高每部作品能赔到15万美元,要真这么算,Anthropic得赔到倾家荡产。所以这150亿和解,看着肉疼,但可能已经是打折价了。
行业震动,AI公司的“Napster时刻”
这案子被很多人叫做AI行业的“Napster时刻”。Napster是早年一家音乐分享平台,因为版权问题被重罚,直接改变了音乐行业的规则。现在AI公司们也到了这个时候:用数据可以,但得合法。
其实不止Anthropic,OpenAI、Meta这些大佬也都被类似诉讼盯着。OpenAI还被爆用过叫Books3的数据集,里面包含将近20万本从Bibliotik等影子图书馆搞来的书。所以这次和解可能只是个开始,后面还有更多戏码。
合法训练 vs 盗版资源,行业走向合规
不过也不是说AI训练就完全没路走了。法官说要是合法买书扫描训练,那还是可以的。一些公司比如OpenAI,已经开始和媒体像Axel Springer、《华盛顿邮报》合作拿授权。Amazon今年5月也和《纽约时报》签了协议。所以出路不是没有,就是得花钱花时间。
和解还没完,法官仍有质疑
虽然和解方案提出来了,但法官William Alsup还没完全点头。他担心作品清单可能还会增加,怕Anthropic后面又被新冒出来的索赔搞懵。所以安排了9月25日再开一场听证会,之前还得在9月15日前交出最终盗版书籍清单,9月22日前提交索赔表格给他审。法官原话是:“到时候我再看看自己能否忍住不吭声,然后给出批准意见。” 这感觉就像老师检查作业,嘴上说“我再看看”,实际心里还没完全放心。
巨额但“付得起”,AI公司的教训
150亿美元听着吓人,但对Anthropic来说可能还算能扛住。这家公司2021年才成立,到现在已经融了超过270亿美元,最近一轮融资就拿了130亿,估值冲到1830亿美元。所以这笔和解金虽然创了纪录,但大概不会让它伤筋动骨。有行业分析师甚至说,科技公司可能就把这种赔偿当“开发成本”了。
作者和出版商联手,行业力量显现
这次和解背后还有个“作者-出版商工作组”在推动,里面包括美国作家协会和美国出版商协会的CEO这些行业大佬。谈判过程也挺戏剧,双方在著名调解员Layn Phillips法官协调下,吵了好几轮,甚至有一个周末通宵达旦谈,最后时刻才达成协议。所以这不仅是法律胜利,也是行业集体行动的结果。
未来影响:输出内容侵权还能告
和解协议里有个条款特别值得注意:它只豁免过去用作品训练的行为,但不豁免因为AI模型“输出内容”可能带来的侵权索赔。也就是说,如果以后Claude生成的回答侵犯了版权,作者们还能告。这等于给AI公司上了个紧箍咒,以后生成内容也得小心了。
总之,Anthropic这150亿的天价和解,不光是个赔钱事,更是给所有AI公司划了条红线:用数据可以,但得走正门,别翻盗版的墙。以后AI想更智能,恐怕得先学会更守法。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|