数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 80|回复: 0

[科技] 微软Azure联手英伟达整大活!全球首套GB300超算集群独家揭秘​

[复制链接]
发表于 6 小时前 | 显示全部楼层 |阅读模式
哎呀,你说现在这科技产品更新换代的速度,简直比我家楼下早餐摊煎饼果子的手速还快。就在今天,微软Azure冷不丁放了个超级大招——他们搞出了全世界第一套正式投入使用的NVIDIA GB300 NVL72超算集群,起个名叫NDv6 GB300虚拟机系列。别看名头里带“虚拟机”仨字,这货可不是你平常租来建网站的那种普通云主机,它是专门给OpenAI这种级别的“算力大胃王”量身定做的,专门用来处理最吃硬件的AI推理任务。说白了,就是给AI模型造了一台能上天入地的超级引擎。

咱们先来瞅瞅这集群到底有多夸张。一个机柜里,硬生生塞进去72块NVIDIA Blackwell Ultra GPU和36颗Grace CPU,整个机柜用液冷系统压住发热,统一当成一个整体来用。算力指标飙到1.44 exaflops(FP4精度),内存容量更是堆到37TB,形成了一个庞大的统一内存空间——这么说吧,差不多能把你从小到大看过的所有电影、文档、高清照片全装进这个统一空间里,还能同时处理不卡顿。OpenAI现在搞的那些超级复杂的推理模型、多模态AI系统,还有所谓“Agentic AI”(能自主干活儿的AI代理),正是最需要这种统一内存空间才能顺畅运行的,以后在这种硬件上跑起来,估计就跟坐超音速飞机似的,嗖一下就出结果。

你可能会问,为啥要搞这么复杂?这不光是堆硬件那么简单。微软和NVIDIA这回属于是把“全系统优化”玩到了新高度。光是把这么多GPU、CPU高效地连起来就不是小事儿。在单个机柜内部,他们用了第五代NVLink交换机,让72块GPU之间能有130TB/s的直接全互联带宽——这相当于在芯片之间修了一条双向1000车道的数据高速公路,谁也不挡谁的道。而要把这么多机柜连成一套超过4600块GPU的超级计算集群,就更考验网络了。Azure用的是NVIDIA Quantum-X800 InfiniBand网络平台,每块GPU独享800Gb/s带宽,还搭载了自适应路由、拥塞控制、以及SHARPv4集合通信加速功能,确保数据在机柜之间跑得又快又稳,不堵车、不丢包。

当然,光有硬件还不够,软件和系统层级也得全面重构。微软为了这套集群,几乎把数据中心从供电、散热到软件调度全重新设计了一遍。Azure负责AI基础设施的副总裁Nidhi Chappell就说,这事情远不止是“把芯片装进去”那么简单,而是双方多年深度合作的成果,是从底层重构数据中心来应对前沿AI负载的体现。说白了,这就是在给下一代AI应用铺硬件基础设施——没有这个,AI再聪明也跑不动。

性能方面,NVIDIA前不久在MLPerf推理v5.1测试里亮过相。同样是跑6710亿参数的DeepSeek-R1推理模型,GB300 NVL72系统比之前的Hopper架构快5倍;新加的Llama 3.1 405B模型测试也轻松拿下领先成绩。这些都说明,Blackwell Ultra平台不光训练给力,推理也更上一层楼——而这正好对应OpenAI这类公司未来需要的大规模模型部署需求。

说起来,这套系统背后是微软和NVIDIA在AI基础设施上多年深度携手结出的果实。从最早搭载V100的NDv2系列,到后来Hopper的H100,再到今天的Blackwell Ultra,两家公司通过长期深入合作,一直在往前推大规模AI集群的边界。而这次GB300 NVL72集群的落地,某种意义上也是在回应像OpenAI这样客户对算力规模越来越"恐怖"的需求——毕竟GPT-4、GPT-5这类模型训练和推理所需的资源,早已不是普通服务器能扛得住的了。

放眼未来,微软还计划部署“数十万块”Blackwell Ultra GPU,这意味着今天的集群只是一个起点。随着这类超算级AI基础设施逐步铺开,我们可能会更快看到Agentic AI、复杂推理、多模态生成式AI真正落地到实际应用中——比如能帮你写长篇报告、做视频剪辑、甚至自主进行科学计算的AI助手。当然,这也意味着高端GPU供应会更紧张,普通玩家想买块显卡打游戏,恐怕还得继续排队。

总之,微软Azure这次推出的NDv6 GB300集群,不只是一次硬件升级,更像是对AI算力未来的一次重新定义。它告诉我们:AI进化到下一阶段,光有算法不够,还得有能托起算法的超级基建。而这一切,才刚刚开始。





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-10-10 19:45 , Processed in 0.124800 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表