英伟达Rubin CPX芯片亮相：专治AI「长篇大论」焦虑症

麻薯滑芝士 · 发表于 3 小时前

科技圈顶流英伟达又整新活了！就在北京时间9月9日深夜，老黄带着他的新"核弹"Rubin CPX闪亮登场。这波操作完全跳过了挤牙膏式的常规升级，哐当一声给那些天天被「上下文长度限制」逼疯的AI开发者们砸了剂特效药——分明是铁了心要把AI模型的「七秒记忆」顽疾连根刨了！顺带着把AI视频生成和代码编写的天花板捅了个窟窿。

这玩意儿到底厉害在哪？

简单来说，现在的AI模型处理长内容时就像让金鱼记电话号码，记到后面就忘了前面。而Rubin CPX直接给AI开了外挂，采用「分离式推理」架构：先用「上下文阶段」像扫描仪似的唰唰唰吞下百万token，再用「生成阶段」像打印机似的咔咔咔输出内容。这种设计让它的长文本处理速度比现有旗舰GB300 NVL72快了6.5倍，简直就是AI界的闪电侠！

具体参数让人直呼离谱：30 petaflops的NVFP4精度算力（相当于每秒钟能进行300亿亿次计算），128GB GDDR7内存（成本只有HBM的一半但带宽爆表），1.7PB/秒的内存带宽（能同时传输1700部4K电影）。最骚的是整套Vera Rubin NVL144 CPX平台，单个机架就能提供8 exaflops算力+100TB内存，性能直接碾压前代7.5倍。

能用它搞点啥有意思的？

• 程序员狂喜：AI编程助手从此不再是「代码补全工具」，而是能通读整个项目代码库的「全栈工程师」。想象一下，你扔给AI一个包含十万行代码的项目，它不仅能理解所有文件关联性，还能精准定位那个写了三年都没人敢动的祖传bug...

• 视频党福音：生成一小时超长视频不再是梦！Rubin CPX内置视频编解码器，能让AI模型同时分析画面内容、音频流和字幕文本，输出连贯不跳戏的长视频。Runway、Cursor这些平台已经连夜开始适配了。

• 商业变现玄学：老黄还画了个神奇大饼——每投资1亿美元就能产生50亿美元token收入。虽然听着像区块链骗局，但考虑到现在AI推理成本居高不下，这个「降本增效」的故事确实让很多企业直搓手。

为什么现在掏出这个宝贝？

显然，这次发布瞄准的就是长上下文处理这个老大难问题。现在的大模型明面上都说着要处理"全书级"内容，真遇上长视频分析或者大型代码库处理时，立马就现出原形。更有意思的是，就在前几天博通刚宣布从某"神秘客户"（圈内都在传是OpenAI）那里拿了100亿美元定制芯片订单。老黄这个时间点选得，要说纯属巧合恐怕没人信吧！

不过要说遗憾也是有的：得等到2026年底才能真正用上。届时会提供两种购买方式——要么和Vera Rubin GPU打包买，要么给已经预订NVL144机架的客户单独加购。考虑到老黄家计算卡历来「价格美丽」的传统，建议各位CTO现在就开始攒预算。

说到底值不值得期待？

Rubin CPX确实展现了英伟达在AI算力领域的深层思考：不再单纯堆算力，而是针对具体场景重构架构。这种「专芯片专用」的思路，可能比通用型GPU更有竞争力。不过竞争对手也在闷声发大财，比如AMD的MI300X同样虎视眈眈，定制芯片市场更是杀成红海。

所以咱们还是保持理性期待：2026年见真章的时候，希望老黄真的能让我们喊出「AMD YES！」——哦不对，是「NVIDIA YYDS！」（手动狗头）

账号		自动登录	找回密码
密码			立即注册

[科技] 英伟达Rubin CPX芯片亮相：专治AI「长篇大论」焦虑症

本帖子中包含更多资源

相关帖子