数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 470|回复: 4

[科技] 硅谷巨头深陷盗书门!82TB侵权数据揭开AI训练黑幕

[复制链接]
发表于 2025-2-10 08:54:04 | 显示全部楼层 |阅读模式
本帖最后由 土耳鸡烤鸡 于 2025-2-10 09:49 编辑

互联网世界又爆猛料——谁能想到,坐拥万亿市值的科技巨头Meta,竟被扒出用盗版书库喂养自家AI!最近曝光的法庭文件显示,这家扎克伯格掌舵的社交帝国,居然通过非法渠道下载了足足81.7TB的图书数据,这相当于把国家图书馆塞进8T硬盘里倒腾了差不多十个来回!(瞎比喻的,大伙儿别太当真)!

事情要从2022年秋天说起。当时Meta内部几位搞AI的"技术大拿"在聊天记录里疯狂打暗号,对话截图现在成了法庭上的"铁证"。一位资深研究员在当年10月的消息里直冒冷汗:"咱真不能碰盗版材料,这事得划清底线啊!"另一个同事更是一针见血,把SciHub、Z-Library这些学术资源网站比作"知识界的海盗湾"。最劲爆的是扎克伯格本尊亲自下场,在2023年1月的会议上拍板:"赶紧想办法给这些破事扫清障碍!"三个月后,有员工发现公司IP地址正在疯狂下载盗版内容,还调侃说"用办公电脑搞种子下载,这操作太骚了"。

要说这帮科技精英的"反侦察"手段也是绝了。法庭文件显示,Meta专门修改了网络配置来掩盖下载痕迹,活脱脱上演现实版《谍影重重》。不过再精明的狐狸也斗不过好猎手,这些精心设计的障眼法现在全成了指控其蓄意侵权的实锤证据。

其实AI训练数据侵权早就是行业"不能说的秘密"。从OpenAI被作家集体起诉,到英伟达因盗用19万本书训练模型被告上法庭,科技巨头们个个都在走钢丝。最讽刺的是,最近OpenAI自己反倒成了"苦主",正在调查竞争对手是否窃取了ChatGPT的数据——这出"黑吃黑"的戏码,看得吃瓜群众直呼魔幻。

眼下Meta这场官司就像悬在头顶的达摩克利斯之剑,虽然公司账上躺着金山银山,但要是真被坐实盗用82TB盗版书籍的指控,怕是要赔得底裤都不剩。不过按照美国司法系统的尿性,这场拉锯战没个三五年估计难见分晓。说到底,这场AI训练数据的"罗生门",暴露的不仅是科技公司的道德困境,更是整个行业在创新与版权之间左右为难的真实写照。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
发表于 2025-2-10 09:43:54 | 显示全部楼层
世界上应该找不到一个不用盗版数据训练的大模型吧?
回复 支持 反对

使用道具 举报

发表于 2025-2-10 09:44:36 | 显示全部楼层
AI原来真的在看书?
回复 支持 反对

使用道具 举报

发表于 2025-2-10 09:55:17 | 显示全部楼层
只有这样才能低成本数据填充,哈哈哈
回复 支持 反对

使用道具 举报

发表于 2025-2-10 10:45:21 | 显示全部楼层
犹太人嘛!!啥都干得出来,不足为奇!!!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-7-23 06:10 , Processed in 0.078000 second(s), 9 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表