谷歌云发布Blackwell超算实例！72组B200 GPU与36颗Grace CPU强强联合

Meise · 发表于 2025-2-21 10:53:34

就在各家大厂忙着给AI模型"增肥"时，谷歌云默默攒出了个"算力军团"——72枚B200 GPU带着36颗Grace CPU组团上云，瞬间把AI推理现场变成了能同时接单数万份的"超级大脑"。这波硬件升级直接让机器学习效率坐上火箭，训练速度比前代产品足足快了四倍！

谷歌云日前正式推出全新A4X虚拟服务器，其核心秘密武器是英伟达最新研发的GB200 NVL72系统。这套堪称"AI算力航母"的配置，每台服务器装载着72颗B200图形处理器和36颗Grace中央处理器，光是CPU部分就塞进了2596个Armv9架构的计算核心。所有硬件通过NVLink高速互联，实现GPU内存池化共享，让超长文本理解和多模态推理任务响应更快、准确度更高。

性能方面，A4X相比前代H100显卡的A3机型，训练效率直接翻了四倍。单台GB200 NVL72系统的算力突破1 ExaFLOPS（百亿亿次浮点运算），在FP8/INT8/FP6精度下更能飙出1440 PetaFLOPS的恐怖性能，无论是训练千亿参数大模型还是同时处理海量推理请求都游刃有余。

为喂饱这些"算力猛兽"，谷歌专门定制了基于ConnectX-7网卡的Titanium ML网络适配器，实现每秒28.8太比特的低延迟GPU间通信。通过自研的Jupiter网络架构，还能把数万台这样的服务器连成超级集群。借助谷歌Kubernetes引擎，开发者甚至能调度多达6.5万个计算节点协同工作。

在存储优化上，Cloud Storage FUSE技术将训练数据吞吐量提升2.9倍，Hyperdisk ML则让模型加载速度加快近12倍。目前A4X主要面向需要超长上下文窗口的LLM、复杂推理模型及高并发场景，而标准版A4虚拟机则适合常规AI训练与调优。虽然具体租用价格尚未公布，但已有开发者调侃："这配置跑起AI来，怕是电表都要转出火星子。"

账号		自动登录	找回密码
密码			立即注册

[电子] 谷歌云发布Blackwell超算实例！72组B200 GPU与36颗Grace CPU强强联合

本帖子中包含更多资源

相关帖子

浏览过的版块