数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 75|回复: 1

[业界] 全美近400家报纸联手起诉OpenAI和微软,指控大规模盗用版权内容训练AI

[复制链接]
发表于 6 小时前 | 显示全部楼层 |阅读模式
各位这会儿正窝在家里刷着手机看新闻、手指划过一篇又一篇报道却很少留意文章作者是谁的普通读者们,还有那些每天靠码字挣稿费、对自己辛辛苦苦写出来的东西被AI抓去训练模型这件事感到既无奈又愤怒的文字工作者们,以及那些经营着本地小报社、眼看着印刷量一年比一年少、广告收入被互联网平台蚕食殆尽的报社老板和编辑们,甚至包括那些平时不太关心版权法怎么规定、但隐隐觉得AI随随便便就把别人的劳动成果拿走用好像哪里不太对劲的路人网友们——今天有个事儿,跟你们所有人都能扯上关系,而且这事儿闹腾的动静相当大。

事情是这样的。就在上个月底,也就是2026年6月26号那天,一群由全美各地将近400家报纸的所有者和运营者组成的联盟,正式向纽约曼哈顿联邦法院提交了一份长达55页的民事起诉状,把OpenAI和微软这两家科技巨头一并告上了法庭。这些出版商指控这两家公司,在未经许可、也没有支付任何报酬的情况下,大量抓取他们的新闻内容,用来训练ChatGPT和Microsoft Copilot这样的人工智能程序。

根据路透社在2026年7月2号发布的报道,这次诉讼是由一位名叫马修·J·普拉特金的律师代理的。这位普拉特金先生的履历可不一般,他从2022年到2026年期间,一直担任新泽西州的州检察长,在法律界的声望和人脉都相当深厚。他代表的这个原告团体,是由全美各地的地方性和区域性新闻出版商组成的联合体,涵盖了从东海岸到西海岸、从大城市到偏远小镇的大量社区报纸和地方媒体。

这些出版商在诉状里说的话,措辞之严厉,态度之坚决,可以说是近年来少见。他们说,OpenAI和微软这种未经授权就大规模复制受版权保护的新闻文章的行为,对于本来就摇摇欲坠、勉强维持的美国地方新闻业来说,无异于是在敲响丧钟。诉状里有这么一段原话,我觉得有必要给你们念一念,感受一下那种愤怒的程度:“这些出版商的新闻报道对于被告的爆炸性增长来说是至关重要的,除非被告为其窃取、剥离和滥用出版商内容的行为承担起应有的责任,否则他们一手策划并从中获取巨额利益的人工智能热潮,将成为地方新闻业的死亡钟声——而地方新闻至今仍然是美国最受信赖的新闻信息来源。”

你仔细品一品这段话,分量有多重。美国的地方新闻业这些年日子过得有多艰难,关注过媒体行业的人多少都知道一些。广告收入被谷歌和Facebook这样的互联网巨头抢走了一大块,纸质订阅量年年下滑,很多社区报纸勉强度日,有的甚至已经关停了印刷业务或者彻底停刊。现在AI公司又来这么一出,等于是在人家本来就流血的伤口上又撒了一把盐。

这次诉讼的主导方是一家总部位于纽约长岛的出版商,名字叫Richner Communications。他们代表整个原告群体,指控OpenAI和微软构成了三项独立的版权侵权行为。他们要求的赔偿内容包括法定赔偿金、实际损害赔偿、要求被告返还违法所得利润,以及支付律师费用。每一项都不是小数目,加起来绝对是个天文数字。

那么,这些出版商具体指控OpenAI和微软做了些什么呢?根据诉状里的详细描述,这两家公司“系统性地、秘密地爬取”了数百个新闻网站的内容,这其中还包括那些设置了付费墙和其他访问限制措施的网站。他们把文章、报道和其他原创作品未经授权就复制到了自己的服务器上。更过分的是什么呢?在复制的过程中,他们还把这些作品附带的所有版权管理信息都给剥离掉了。这些被剥离的信息具体包括哪些呢?包括用来确立作者身份的署名信息、出版物名称、使用条款信息以及版权声明。换句话说,你辛辛苦苦跑了几天采访、熬了几个通宵写出来的一篇深度调查报道,发表在报纸上,结果被AI公司的爬虫抓去训练模型了,你的名字被抹掉了,报纸的名字也被抹掉了,版权声明也被删了,就好像这篇文章是无主之物一样,谁都可以拿来用。

出版商们在诉状中指出,这种剥离版权管理信息的做法,是被告“数据摄取管道中不可或缺的一个组成部分”,其目的就是切断被复制内容与其合法版权所有者之间的关联。没有了这些标识信息,就很难追查这些内容的原始来源,也很难追究侵权责任。

这些被剥离了版权信息的内容,最终被用来训练OpenAI和微软的大型语言模型。出版商们声称,这些模型“记住了”这些受保护的材料,并且在过去几年里,当用户输入相关的提示词时,很有可能原封不动或者几乎原封不动地把这些内容重新输出出来。这等于说,AI不仅学习了你的文章内容,还能把你文章里的大段原文直接吐出来给提问的人看,而且完全不提及这是你写的、是哪家报纸发表的。

诉状里还特别提到了微软在这场合作中扮演的角色。微软在2019年向OpenAI进行了初始投资,金额是10亿美元。从那以后,两家公司的合作关系越来越紧密,微软把OpenAI的技术深度整合进了自己的产品体系里。出版商们把微软描述为“在OpenAI商业企业的几乎所有方面都是不可或缺的合作伙伴”。言下之意很清楚:微软别想把自己摘干净,你们俩是一条绳上的蚂蚱,谁也跑不了。

这些出版商还强调,大规模的版权侵权行为发生之时,正是美国地方新闻业处境极度不稳定、公众舆论严重分裂之际。他们引用了Democracy Fund对多项研究的分析结果,指出地方新闻业在促进公民参与投票和社区事务、增强社区居民之间的凝聚力和归属感,以及减少政府和机构的腐败行为等方面,发挥着不可替代的重要作用。换句话说,地方新闻不仅仅是在报道发生了什么事,它还是在维系整个社会肌体的健康运转。如果地方新闻业被AI公司搞垮了,受损的不仅仅是报社老板们的钱包,更是全社会每一个人的公共利益。

路透社的报道说,他们分别在今天,也就是2026年7月2号星期四,联系了OpenAI和微软的代表,希望获得两家公司对此事的官方回应,但截至发稿时,两边都没有立即回复。

说到OpenAI这家公司本身的背景,也挺有意思的。OpenAI最初是在2015年作为一个非营利组织成立的,到现在为止,它的非营利董事会仍然控制着那个开发和销售AI产品的营利性子公司。这家总部位于旧金山的人工智能公司,在今年3月份的时候曾经对外宣布,在一轮规模高达1220亿美元的融资之后,公司的估值正朝着8520亿美元的方向一路狂奔。这轮融资的投资方阵容相当豪华,包括了亚马逊、软银和英伟达这些在全球科技行业呼风唤雨的企业。你对比一下这几个数字:1220亿美元的融资额,8520亿美元的估值,再看看那些为了几万美元的广告费愁白了头的地方报纸主编,这种巨大的反差确实让人心里很不是滋味。

另外值得一提的一点是,这并不是OpenAI第一次因为版权问题被推上被告席。就在今年早些时候,也就是2026年年初,大名鼎鼎的百科全书出版商大英百科全书公司,以及它旗下的韦氏词典子公司,也在纽约南区联邦法院起诉了OpenAI。他们的指控跟这次报纸联盟的指控如出一辙,也是说ChatGPT的训练软件在未经授权也没有支付报酬的情况下,对数字出版商的受版权保护的在线内容进行了“大规模复制”。

所以你看,围绕着人工智能和版权保护之间的矛盾冲突,这场官司绝对不是孤立的个案。随着AI技术越来越深入地渗透到内容创作和知识生产的各个领域,类似的纠纷只会越来越多,争议也会越来越激烈。这次近400家报纸联手起诉OpenAI和微软,可以说是迄今为止规模最大、覆盖面最广、影响力也最深远的一次集体维权行动。最终法院会如何判决,会不会对整个AI行业的数据获取方式和训练模式产生颠覆性的影响,咱们还得持续关注后续的发展。但对于所有靠创作内容吃饭的人来说,这场官司的结果,无疑将成为一个具有风向标意义的里程碑。赢了,或许能为内容创作者争取到应有的权益和尊重;输了,那可能就意味着,在AI时代,原创内容的价值将被进一步稀释和忽视。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
发表于 6 小时前 | 显示全部楼层
游客请登录后查看回复内容
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|数码之家-技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2026-7-2 14:14 , Processed in 0.093601 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz!

© MyDigit.Net Since 2006

快速回复 返回顶部 返回列表