NVIDIA发布Spectrum-XGS以太网将全球数据中心连成巨型超算

Meise · 发表于 3 小时前

哎，朋友们，今天唠个硬核但贼带劲的科技大新闻！你们知道吗？老黄他们家NVIDIA最近又整新花样了——不是新显卡，不是新芯片，而是一张叫 Spectrum-XGS 的“超级网络”！这玩意儿野心不小，是想把全世界散装的数据中心全都连起来，变成一台巨无霸AI超级计算机！

简单来说哈，以前人们总觉得数据中心里堆满GPU就够了，但其实它们互相怎么高效“聊天”才是关键！尤其现在AI模型越来越庞大，训练任务动不动就横跨几个国家，网络要是拉胯，再强的算力也白搭！

那Spectrum-XGS咋搞定这问题？它不用换硬件！直接通过软件和固件升级现有的Spectrum-X交换机和ConnectX网卡，就解锁了一个超能力——叫“距离感知网络”！甭管你的服务器是在同一个楼、不同城市，还是隔着一个太平洋，它都能自动调节数据传输节奏，保证不堵、不抖、不延迟！

具体来说，这波操作有三狠：

长距离链路自动控流，跟智能导航绕开拥堵似的；

精准控制延迟，最大限度减少抖动；

全网可视化管理，哪条线慢、哪个点卡，运维一眼看清！

效果咋样？NVIDIA直接甩数据了：多GPU、多节点的AI训练任务里，通信吞吐量翻了将近一倍！也就是说，以前训练一个大模型要十天，现在可能只要五天半！

老黄管这叫“Scale-Across”——也就是“跨规模互联”。这相当于在单机升级（Scale-Up）和机房扩展（Scale-Out）之后，终于把全世界的算力给“织”成了一张网！

现在像CoreWeave这种算力大厂已经准备上车了，打算把分布各地的数据中心合成一台“虚拟超算”，让客户用上更大规模的算力，搞那些跨洲际的AI实验也更省事儿~

这技术目前已经正式推出，还在Hot Chips大会上秀了一波。虽说更多细节还没完全公开，但可以确定的是：以后AI训练的规模，真的只取决于电网够不够电了！

账号		自动登录	找回密码
密码			立即注册

[科技] NVIDIA发布Spectrum-XGS以太网将全球数据中心连成巨型超算

本帖子中包含更多资源

相关帖子

[科技] NVIDIA发布Spectrum-XGS以太网 将全球数据中心连成巨型超算

本帖子中包含更多资源

相关帖子

[科技] NVIDIA发布Spectrum-XGS以太网将全球数据中心连成巨型超算