数码之家

 找回密码
 立即注册
搜索
查看: 144|回复: 0

[电子] 谷歌云发布Blackwell超算实例!72组B200 GPU与36颗Grace CPU强强联合

[复制链接]
发表于 2025-2-21 10:53:34 | 显示全部楼层 |阅读模式
就在各家大厂忙着给AI模型"增肥"时,谷歌云默默攒出了个"算力军团"——72枚B200 GPU带着36颗Grace CPU组团上云,瞬间把AI推理现场变成了能同时接单数万份的"超级大脑"。这波硬件升级直接让机器学习效率坐上火箭,训练速度比前代产品足足快了四倍!

谷歌云日前正式推出全新A4X虚拟服务器,其核心秘密武器是英伟达最新研发的GB200 NVL72系统。这套堪称"AI算力航母"的配置,每台服务器装载着72颗B200图形处理器和36颗Grace中央处理器,光是CPU部分就塞进了2596个Armv9架构的计算核心。所有硬件通过NVLink高速互联,实现GPU内存池化共享,让超长文本理解和多模态推理任务响应更快、准确度更高。

性能方面,A4X相比前代H100显卡的A3机型,训练效率直接翻了四倍。单台GB200 NVL72系统的算力突破1 ExaFLOPS(百亿亿次浮点运算),在FP8/INT8/FP6精度下更能飙出1440 PetaFLOPS的恐怖性能,无论是训练千亿参数大模型还是同时处理海量推理请求都游刃有余。

为喂饱这些"算力猛兽",谷歌专门定制了基于ConnectX-7网卡的Titanium ML网络适配器,实现每秒28.8太比特的低延迟GPU间通信。通过自研的Jupiter网络架构,还能把数万台这样的服务器连成超级集群。借助谷歌Kubernetes引擎,开发者甚至能调度多达6.5万个计算节点协同工作。

在存储优化上,Cloud Storage FUSE技术将训练数据吞吐量提升2.9倍,Hyperdisk ML则让模型加载速度加快近12倍。目前A4X主要面向需要超长上下文窗口的LLM、复杂推理模型及高并发场景,而标准版A4虚拟机则适合常规AI训练与调优。虽然具体租用价格尚未公布,但已有开发者调侃:"这配置跑起AI来,怕是电表都要转出火星子。"

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-12 05:12 , Processed in 0.140400 second(s), 10 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表