数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 52|回复: 0

[业界] 硅谷新贵柠檬片狂揽1050万刀 要给你造个吐沫星子横飞的赛博自己

[复制链接]
发表于 1 小时前 | 显示全部楼层 |阅读模式
哎哟我去,家人们!最近硅谷那边又有个新玩意儿杀疯了,搞得风投老爷们拿着支票本一路小跑着去送钱。就在这周二,2024年才蹦出来的一个叫“柠檬片”(Lemon Slice)的初创公司,啪一下,拿到了1050万美元的种子轮融资!

谁给的钱?来头不小。领投的是Matrix Partners,还有那个鼎鼎大名的创业孵化器Y Combinator(简称YC)。跟投的名单更闪瞎眼:Dropbox的首席技术官Arash Ferdowsi、Twitch的CEO Emmett Shear,甚至连那个唱《Closer》的烟鬼组合The Chainsmokers都来凑热闹了。这阵容,你就说这项目得有多燥吧。

这公司到底搞啥的?简单一句话:他们不想让你只跟AI“打字”聊天了,他们要给你造个“活”的数字分身,能说、能动、能视频直播那种!

我知道你咋想。“数字分身?这玩意儿不是早就有了吗?那些网课里假了吧唧的主播,还有客服页面那个僵硬微笑的虚拟人,看着就挺‘阴间’的,聊两句我尴尬癌都犯了。”

哎,你这话可说到点子上了!“柠檬片”的联合创始人兼CEO,莉娜·科鲁奇(Lina Colucci)原话就是这么喷的。她说:“截止目前,我见过的现有数字分身解决方案,都在给产品增加负价值!” 没错,是负的!她说那些分身“令人毛骨悚然(creepy),而且非常僵硬(stiff)。可能好看个几秒钟,但你一旦开始和它们互动,就会产生一种非常诡异(uncanny)的感觉,根本没法让你放松。” 她认为,数字分身这玩意儿一直没真正火起来,根本原因就一个字:不够好!

所以,“柠檬片”撸起袖子,决定自己从根儿上重新造轮子。他们搞出了一个自家的大模型,名叫“柠檬片-2号”(Lemon Slice-2)。这可不是小打小闹,这是个拥有200亿参数的扩散模型。啥是扩散模型?就是像DALL·E、Stable Diffusion那种能“无中生有”生成图片视频的AI核心技术路径。他们就用这种“生成式AI”的核武器,专门来攻克数字分身。

最狠的是啥?他们号称,你只需要给一张照片,就一张!这个模型就能给你生成一个专属的数字分身。这个分身不是个呆板的面具,它能套在你设定的任何一个“知识库”上,扮演任何角色。比如,让它当24小时在线的客服小姐姐,回答产品问题;让它化身成暴躁的数学老师,给你讲微积分;甚至,让它成为一个有耐心的心理健康支持助手,听你唠嗑。

“在生成式AI的早期,我的联合创始人们就开始鼓捣各种视频模型,那时候我们就很明显感觉到,视频的未来一定是交互式的。” 莉娜·科鲁奇说,“像ChatGPT这类工具最吸引人的地方就是它们的交互性,而我们希望给视频也加上这层交互能力。”

技术细节来了啊,硬核但咱唠明白。这个“柠檬片-2号”模型,他们说只需要单个GPU,就能以每秒20帧的速度实时直播这个数字分身的视频流!20帧,已经相当流畅了,直播够用。公司把这个能力做成了一个API(应用程序接口)和一个可嵌入的小插件,其他公司想用,只需要在自家网站上加一行代码就能接进去。而且,分身造好之后,你还能随时给“他/她/它”换背景、换造型、换穿搭,跟玩换装游戏似的。

除了真人风格的分身,他们还能生成各种非人类角色。你想来个卡通狐狸当导游?或者让一只会说话的咖啡杯介绍产品?都没问题。声音部分,他们目前用的是行业里另一家明星公司ElevenLabs的技术来合成。

看到这儿,你可能会问,这赛道没别人了吗?卷死了好吗!做视频生成的D-ID、HeyGen、Synthe sia,做数字分身的Genies、Soul Machine、Praktika、AvatarOS……全都是竞争对手。那凭啥“柠檬片”能拿钱?

投资人可不是傻子,他们账算得门儿清。Matrix Partners的合伙人伊利亚·苏克哈(Ilya Sukhar)就说了,他认为数字分身在视频主导的领域会特别有用。比如,现在多少人学东西宁愿上B站、YouTube看视频,也不愿读长篇大论的文字?他看中“柠檬片”两点:一是技术实力,二是他们的通用模型路线。

“这是一个有深厚技术背景的团队,有成功交付机器学习产品的记录,不仅仅是做些演示和研究。” 苏克哈说,“很多其他玩家都是为特定场景或垂直领域定制的,而‘柠檬片’走的是通用的、‘苦涩教训’式的扩展路径(指依赖数据和算力规模),这条路径在其他AI模式中已经被验证是可行的。”

YC的合伙人贾里德·弗里德曼(Jared Friedman)吹得更猛。他认为,采用扩散模型让“柠檬片”能生成任何类型的分身,而其他一些初创公司要么只专注于真人类型,要么只专注游戏角色类型。

“我相信,‘柠檬片’是唯一一家采取这种根本性机器学习方法的公司,这种方法最终有可能克服‘恐怖谷效应’,甚至通过‘数字分身图灵测试’。” 弗里德曼这话说得相当重了。“他们训练的和Veo3、Sora是同一种模型:视频扩散Transformer。因为这是一个端到端的通用模型,它的能力上限是无限的;而其他技术的天花板,在达到照片级真实感之前就封顶了。而且它同时适用于人类和非人类面孔,只需要一张图片就能添加新面孔。”

当然,这么强的能力,大家肯定担心滥用,比如未经允许克隆别人的脸或声音。公司说他们设置了“护栏”来防止这种情况,并且会使用大语言模型来进行内容审核,防止分身胡说八道干坏事。

目前,“柠檬片”还捂着客户名单没完全公开,但他们透露,模型已经被用在教育、语言学习、电子商务和企业培训这些地方了。公司现在只有8名员工,这笔新到账的1050万美金,主要用途就是招兵买马(扩招工程师和市场营销人员),以及支付训练这些吞金巨兽般模型所需的巨额云计算账单。

所以,这事儿你看明白了吗?下一波AI交互的升级,可能就来自从“文字聊天框”到“视频面对面”的这层窗户纸。“柠檬片”这帮人,就是想用一张照片的成本,造出第一个让你觉得不尴尬、不惊悚、甚至有点想多聊几句的数字分身。这1050万美金,就是赌他们能把这“一片柠檬”,榨出颠覆性的汁水来。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-12-26 14:01 , Processed in 0.093601 second(s), 9 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表