数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 32|回复: 0

[业界] 老黄刀法精准切向推理,OpenAI的算力心病有救了?

[复制链接]
发表于 3 天前 | 显示全部楼层 |阅读模式
哎,我跟你们说,尤其是那些搞AI的、蹲硬件的、还有天天盯着ChatGPT什么时候不“抽风”的兄弟们,赶紧搬小板凳过来!今儿这瓜,又大又圆,直接关系到接下来咱们手里的AI到底能有多“聪明”,反应能有多快。

事情是这样的。就在刚过去不久的2月28号,路透社那边甩出来一篇报道,引用了《华尔街日报》在2月27号周五曝出来的一个猛料。爆料人说啊,那个在AI芯片界已经“杀”疯了的巨头——英伟达,嗯,就是咱们老在新闻里见到的那个Nvidia,它又在偷偷憋一个大招了。

他们打算推出一款全新的处理器,专门就是为了解决一个让所有AI公司,特别是让OpenAI这种顶级玩家都头疼得要命的问题:AI“推理”的速度。啥叫“推理”?简单说,就是你问ChatGPT一个问题,它吭哧吭哧在后台调动千亿参数,给你生成一个答案,这个过程就叫推理。训练AI是让它学知识,而推理是让它用知识干活儿。现在的问题是,对于某些特别复杂、特别专业的活儿,比如让它帮你写代码,或者让AI去跟其他软件系统对话,现有的芯片干起来有点“力不从心”,反应不够快。

路透社自己上个月就报过,OpenAI对Nvidia硬件在某些特定问题上的响应速度,不太满意。他们需要更快、更专的硬件。有多需要呢?根据路透社挖到的内部消息,OpenAI未来可能需要有大约10%的推理计算,都得靠这种全新的、速度更快的硬件来搞定。10%听着不多,但你要知道OpenAI那个计算规模,10%就是个天文数字的算力需求了。

好,需求端嗷嗷待哺,供应端在干嘛呢?OpenAI也不是没找过别人。消息说,他们之前找过几家初创公司聊合作,比如Cerebras,还有一家叫Groq的。特别是这个Groq,他们家搞的芯片,就是以推理速度快著称的,之前在一些测试里,速度表现相当亮眼,被不少人看好是能“偷袭”一下老黄的后院。

但!是!姜还是老的辣,刀法还是老黄的精准。你猜怎么着?就在OpenAI和Groq眉来眼去,可能都快谈婚论嫁的时候,Nvidia出手了,而且是一击致命。他们直接和Groq签了一个价值高达200亿美元的授权协议。200亿啊兄弟们!这哪是合作,这简直就是直接把Groq这位“潜力新秀”给“招安”了。路透社的消息源说,这一下子,直接把OpenAI和Groq的谈判给搅黄了。你想嘛,核心技术都授权给Nvidia了,OpenAI再去找Groq买芯片,岂不是相当于绕了个弯子还是给Nvidia送钱?这生意就没法谈了。

这还没完,咱们把时间线再往前倒一倒。去年九月,也就是2025年9月,还有一件大事。Nvidia宣布,他们打算向OpenAI投入最多高达1000亿美元的资金。这笔钱一方面是换取了OpenAI的一部分股权,成了它的股东;另一方面,这巨款明摆着就是给OpenAI“输血”,让他们有足够的现金去买谁家的芯片呢?哎,对,就是买Nvidia自家最先进的那批芯片。

你看懂这个连环套了吗?我给你们捋捋啊:
第一步(2025年9月):我给你(OpenAI)一千亿,你是我股东,你有钱了,得买我的顶级芯片来训练和运行你的模型。
第二步(2026年2月前):你(OpenAI)觉得我某些芯片推理不够快,想去找别的快小子(比如Groq)帮忙。
第三步(现在爆出的消息):我(Nvidia)反手用二百亿,把那个你快小子(Groq)的核心技术给“包”了,让你找不着别人。
第四步(即将发生的未来):下个月,在我的GTC开发者大会(就在加州圣何塞开)上,我亲自发布一个全新的推理计算平台。而这个新平台里,就会用上我从Groq那儿“包”来的芯片技术。

这一套操作下来,你什么感觉?我的感觉是,OpenAI那份对“推理速度”的焦虑和渴望,Nvidia不仅门儿清,而且早就布好了局。你不是嫌不够快吗?行,我亲自给你造一个更快的。你不是想找别人吗?我把你觉得可能最快的那个人,直接变成我团队的一部分。

所以,《华尔街日报》这次曝出来的,就是第四步——那个即将亮相的新平台。它不是一个简单的芯片升级,而是一个专门为“推理”这个环节设计的全新系统。这意味着Nvidia的战术重心,已经从单纯追求训练芯片的“大力出奇迹”,开始精准地延伸到AI实际应用时的“最后一公里”提速上了。

这对我们普通用户有啥影响呢?最直接的,就是以后咱们用ChatGPT,或者用任何基于大模型的产品,它可能会反应更快,尤其是在处理一些复杂任务的时候,那种“卡顿思考”的感觉会减少。对于开发者来说,部署和运行AI模型的成本(特别是时间成本)有可能降低。

但对整个行业来说,这消息更像是一枚“定心丸”兼“警示牌”。定心丸是给那些依赖Nvidia生态的公司的:别慌,你们的痛点老大都知道,并且已经在解决了。警示牌是给其他芯片厂商的:老黄不仅在训练领域筑起了高墙,现在又开始在推理这个快速增长的市场挖壕沟了,而且用的是“投资+合作+自研”的立体打法。

最后扯回来,路透社在报道里也说了,他们暂时还没法独立核实这个消息,而且Nvidia和OpenAI对这报道也没立刻回应。但考虑到路透社和《华尔街日报》的口碑,以及之前那些丝丝入扣的铺垫,这事儿的真实性,我看八九不离十。

所以,下个月Nvidia的GTC大会,可有好戏看了。咱们就等着看,老黄这回掏出来的,到底是一把怎样专门为“推理”而磨快的“新刀”。这刀法,恐怕又要改变整个AI算力市场的游戏规则了。搞硬件的兄弟,你们的PPT是不是又得熬夜改了?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2026-3-4 01:41 , Processed in 0.234000 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2026 MyDigit.Net

快速回复 返回顶部 返回列表