|
近期,一份爆料让很多内容创作者有点懵。CNBC媒体了解到,谷歌公司(Google)一直在利用自家YouTube平台上的海量视频资源,来训练其人工智能模型。这其中包括像Gemini聊天助手和最新的AI视频生成工具Veo 3这样的尖端产品。
内部人士(要求匿名)向CNBC透露,谷歌动用了YouTube库里整整200亿个视频来“喂养”这些新时代AI工具。虽然谷歌公司后来承认了这事,但强调说他们只用了一部分视频做训练,并且会严格遵守他们与内容创作者及媒体公司之间的特别协议。
YouTube的官方发言人甩出了一份声明,大意是:“我们一直都用YouTube的内容来让自家产品更好使,搞AI也没改变这路子。当然,防护栏我们也安排上了,花了大价钱整了靠谱的保护措施,就为了让创作者在这个AI时代能护住自己的形象和样子,这事我们会坚持干下去。”
不过,专家们提醒这事儿搞不好要炸开锅,弄出一场内容创作者和媒体公司的知识产权大危机。
有趣的是,尽管YouTube公司坚称这事儿他们“早说过了”,但专家们告诉CNBC,很多创作者和媒体公司压根儿不清楚谷歌在用YouTube视频集训练AI这档子事。
关键问题来了——YouTube那200亿视频大库里,具体用了哪些、用了多少来投喂AI?谷歌嘴巴挺严,一个字都没漏。但掰着手指头算算,这平台规模实在太大,就算只挑1%的视频做训练,里面的内容时长能堆到23亿分钟。专家们一看,我的天,这量可比竞品AI用的训练数据多了40倍不止!
其实早在去年9月的一篇官方博客里,YouTube曾提过那么一嘴,说用户上传的内容可能被用来“提升产品体验……包括用于机器学习和AI应用场景”。但闹心的是,用户上传完视频后,根本没辙去跟谷歌说:“别用我的片子搞训练了!”
专帮创作者保护数字身份的Loti公司老总卢克·阿里戈尼(Luke Arrigoni)点出问题所在:“他们(谷歌)很可能顺手就拿了很多创作者费老大劲、花心思做的视频来训练AI。这不是在帮Veo 3弄出一个模仿这些创作者的‘合成版山寨货’嘛?这对创作者公平吗?”
CNBC去找了几个大火的创作者和懂知识产权的大佬聊了聊,这些人里压根没人早知内情,或者说,压根没人接到过YouTube的正式通知。
等谷歌在5月份高调亮出Veo 3——这个市面上顶流AI视频生成器——后,再传YouTube用用户视频训练AI的事,就特别引人寻味了。谷歌那会儿还放了段演示,展示出电影级别的小视频:一条船上坐着老头,另一段演着像皮克斯风格的动物聊家常的场景。重点是,整个画面、连音效,全部是AI“生”出来的。
YouTube官方自己也说过,现在平台每天都能收获2000万的新鲜视频,由独立创作者和几乎所有主流媒体公司上传。好些创作者现在开始担心,自己是不是在不声不响地帮谷歌训练一套可能后来替代自己、跟自己抢饭碗的“对手系统”呢?
卢克·阿里戈尼说得很直白:“公开说用啥类型视频、用了多少视频训练,对他们(谷歌)竞争方面又没半点亏吃。真要有什么后果,那也就是他们和创作者之间的那点信任关系被伤到。”
专家们进一步点明,即便Veo 3最后生成的新东西没直接复制现有的作品,AI搞出来的内容也都是在给商业化工具“添柴加火”。而这些工具,到头来是要跟提供原始训练数据的创作者们抢饭吃的。更要命的是,这事儿没给创作者打声招呼,提都不提钱的事,署名权就更甭想了。
那么这事儿的根子在哪儿呢?只要上传视频到平台,按服务条款,用户就等于给了YouTube一个超级宽的通行证——上面写着:“通过向服务提供内容,您授予YouTube一个全球性的、非独家的、免版权费的、可再授权和可转让的许可,来使用该内容。”
替人护形象(防滥用)也管授权生意的Vermillio公司老总丹·尼利(Dan Neely)发愁了:“平台上搞的‘假创作者’冒牌货一直在增加,像Veo 3这号新工具怕是要火上浇油。”
丹尼利和公司没少跟各家AI平台较劲儿,告它们生成的内容侵权(侵犯个人或公司的知识产权)。他觉得,虽说YouTube用内容的确合规合法,但太多在平台上传东西的人压根没想到自个儿的视频被拿去给AI生成软件当学习资料了。
Vermillio公司有个“独门秘籍”叫Trace ID的工具,专门去判断AI生成的视频和真人搞的原创视频“撞车”程度有多高。丹尼利解密说,Trace ID会打出个0到100的分值,该评分按片段为单位计算,且音频和视频是分开评测的。一段带声音的视频,哪怕超过10分,就说明它和原型关联太深,这事儿不简单。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|