数码之家

 找回密码
 立即注册
搜索
查看: 143|回复: 0

[电子] 博通推出102.4T光电交换芯片,直指英伟达AI网络霸主地位​

[复制链接]
发表于 3 天前 | 显示全部楼层 |阅读模式
各位看官,芯片巨头博通(Broadcom)最近放出消息,他们的全新“战斧6”(Tomahawk 6/Tomahawk 6 CPO)交换芯片已经开始供货了!这款芯片,就是博通拿出来和英伟达(Nvidia)即将推出的Quantum-X(量子X)InfiniBand交换机以及Spectrum-X(频谱X)以太网交换机正面硬刚的拳头产品,目标直指当下火热的AI网络市场。

这事儿背景可不简单。在构建大型AI集群内部连接方面,大家知道英伟达的InfiniBand技术一直以来都是首选,以太网(Ethernet)相对落后。但最近一年的风向变了,好多著名的AI大项目开始转投以太网的怀抱,用这种更通用的网络技术来连接成千上万的GPU干活。比如埃隆·马斯克的xAI,他们正在美国田纳西州孟菲斯搞的那个拥有20万块GPU的“巨人”(Colossus)超算,用的就是以太网!权威调研公司Dell'Oro Group的分析师萨梅赫·布杰尔本(Sameh Boujelbene)甚至告诉我们,她认为到了今年,以太网在AI网络的市场份额已经超过了InfiniBand。

所以你看,博通想挤进这个核心战场,不仅要应付英伟达的InfiniBand交换机Quantum-X,还要面对它的高性能以太网交换机Spectrum-X,据说后者在数据中心网络市场的营收,再过一两年就有望挑战行业老大思科(Cisco)。

面对这种竞争强度,博通明显是提速了。按照博通战斧系列产品线经理皮特·德尔·维奇奥(Pete Del Vecchio)的说法,他们通常从开始给集成商“发货”芯片到设备真正上市,得花大约两年时间。但这次,战斧6的进展快得多!采用这种芯片的第一批交换机,最快这个夏天(2025年夏季)就能跟大家见面,明年(2026年)上半年就能实现大规模量产出货。这节奏,明显是铆足了劲要拼抢。

​​战斧6具体有啥厉害之处?​​

性能参数上,这款代号TH6的芯片相当生猛:拥有高达102.4Tbps的总带宽,使用了200Gbps速率的PAM4串行器/解串器(SerDes)。这意味着单个交换机设备可以支持高达512个200Gbps速率的端口!如果你想追求每个端口的极速,也能做到64个1.6Tbps速率的端口。这速度和规模,确实够给力。

更关键的是内部结构变化。相比上一代战斧5(Tomahawk 5)采用的单一巨无霸设计(monolithic),战斧6用上了更灵活的小芯片(chiplet)架构。简单理解,就是把负责高速信号收发的SerDes单元,从负责数据处理和流量管理的核心芯片里分离了出来。这样做灵活性更高,甚至能配置出多达1024个100Gbps速率的SerDes接口来适应不同需求。

德尔·维奇奥强调,由于战斧6的端口密度和带宽提升,现在用200Gbps连接组建拥有高达128,000块GPU的大规模并行网络(Scale-out Fabrics)时,只需要两层网络拓扑就够了。而以前,可能需要三层才行。这种方式能够有效减少数据传输的“中转站”(hops),降低延迟,简化网络拥堵管理,最重要的是,据说能把整个网络所需的总功耗砍掉一半!当然啦,这些好处主要归功于芯片带宽的跃升,只要是能达到102.4Tbps的交换机芯片,比如英伟达的同类产品,同样会具备类似的效率优势。

除了连接超多机器(Scale-out),博通还想用战斧6挑战一下连接少数高端机器的网络(Scale-up),这通常是英伟达NVLink技术的战场。Scale-up网络的特点是追求单根连接的超高带宽,它把多块物理GPU的计算和内存资源“捏合”成一个逻辑整体。例如,英伟达的HGX B200平台用NVLink把8块GPU连成一体,而它的NVL72机架则是通过多个NVLink交换机把72块GPU连在一起。

博通声称,依靠战斧6支持的以太网技术,一样能做到这种机器内部的高速互联。战斧6甚至能支持高达512块GPU以200Gbps速度组成Scale-up网络!当然,要想连接更多GPU,就得额外加交换机或做端口汇聚了。

这种做法其实英特尔(Intel)在自家Gaudi加速器上也用过。每块Gaudi3模组都配有24个200GbE端口,其中3个用于外部Scale-out网络,剩下的端口就让同机箱的8个加速器之间互相通讯,双向总带宽能达到大约1TBps!然而,基于以太网的Scale-up方案未来能不能流行还不好说,毕竟一个名叫“超高速加速器互连”(Ultra Accelerator Link, UAL)的新标准,正获得英特尔和AMD等芯片厂商的支持,势头挺猛的。

​​光电同封装:把激光和芯片“焊”一起的新玩法​​

除了传统交换机形态,战斧6还有个更炫酷的变种版本——集成了光电同封装(Co-Packaged Optics, CPO)技术。这项技术直白点说,就是把以前独立做成可插拔光模块的那些关键部件——激光器、数字信号处理器(DSP)和信号再生器(Retimers)——一股脑儿集成到交换机芯片的封装里,不再需要一个端口配一个光模块。

博通在CPO这块砸钱研究也不是一天两天了,早在2021年的洪堡(Humboldt)系列交换机上就有尝试。不过直到去年,他们才在上一代战斧5-Bailly平台上开始量产发货CPO交换机。而这次伴随战斧6一起亮相的最新CPO平台,其核心能力早在Computex(台北国际电脑展)上就预展过:它实现了每条光通道高达200Gbps的传输能力,完美适配战斧6芯片的需求。

对于动辄数万GPU组成的大型AI集群,CPO好处多多:第一,它省掉了交换机上那些昂贵又耗电的可插拔光模块(至少交换机这端省了);第二,它能在交换机前面板挤进更多光纤端口,比传统的QSFP笼子(光模块插座)密度高得多;同时,减少可插拔模块意味着连接点少了,一方面降低了故障点,另一方面也缩短了光纤到芯片之间的距离,理论上能进一步压榨延迟。不难理解,为什么博通和英伟达都如此热衷CPO技术——网络环节省下的电,就能多分给GPU使用啦!

不过,饭要一口一口吃。CPO目前还是新生事物。大家主要担心的,是这种把光电器件和芯片“绑定”的整合系统,会不会维护起来很麻烦?万一某个激光器或者光芯片坏了,会不会导致整个交换机甚至更大范围的网络出问题?毕竟以前一个光模块坏了,拔下来换新的就完事了,成本也低。博通光学系统部门营销副总裁马尼什·梅塔(Manish Mehta)倒是给我们“喂了颗定心丸”,说早期证据显示这些担忧可能被夸大了:“连续波激光源虽然是独立安装的,但它其实很少出故障。”

​​博通 VS 英伟达:芯片 vs 整机,参数还得比一比​​

看到这里,各位是不是好奇博通的战斧6跟英伟达的新家伙比如何?我们把参数摊开来瞧瞧。

今年春天英伟达在GTC(GPU技术大会)上宣布,其下一代Quantum-X InfiniBand交换机和Spectrum-X以太网交换机,将抛弃传统的QSFP插座,拥抱CPO并配上大量MPO(多光纤通道)接口。英伟达的Quantum-X光子交换机预计今年晚些时候上市,号称能提供144个800Gbps速率的InfiniBand端口。粗看这端口数量可比博通的战斧6多,但重点来了:Quantum 3450-LD 指的是成品交换机设备,而博通Tomahawk 6目前官宣的只是一个交换机处理芯片(ASIC)。英伟达需要在一个Quantum-X设备里塞入4个这种CPO模块才能实现115Tbps的总带宽(有分析指出要达到完全无阻塞可能得6个芯片,但英伟达声称4个就够了)。更合适的比较对象,应该是英伟达基于单芯片方案的Spectrum SN6810以太网交换机。它也是102.4Tbps带宽,支持最多128个800Gbps速率端口。

如果还觉得不够劲爆,英伟达还有个“怪兽”级产品SN6800交换机,带宽直接堆到四倍,达到惊人的409.6Tbps,具备512个MPO光口,每个支持800Gbps传输。这带宽足以让一台设备就能支持包含64台DGX B200主机的大型群集!

博通的德尔·维奇奥还不忘补充个看点:英伟达的Spectrum交换机为了实现接近InfiniBand那样的低延迟性能,必须搭配自家的ConnectX superNICs(超级网卡)或BlueField DPU(数据处理单元)。但咱们的战斧6凭借其“认知路由”(Cognitive Routing)功能,理论上能配合任何现代网卡就能达成差不多的低延迟效果。

​​结语:谁能吃下AI网络这口大蛋糕?​​

总结下时间线:英伟达的Quantum-X光子交换机,预计今年下半年面市;其Spectrum-X CPO整机,则要等到2026年才会登场。博通则预期其合作伙伴们的CPO版战斧6以太网交换机,大约也会在同期推出市场。当然啦,如果你现在就想尝尝CPO交换机的鲜,市场上其实已经有几家网络设备商(比如Micas Networks),在销售基于博通上一代51.2Tbps Tomahawk 5-Bailly平台的CPO交换机了。

这场围绕着AI网络万亿级带宽和高效率互联的巨头之战,随着博通战斧6的强势加入与英伟达的步步紧逼,毫无疑问会更加白热化。谁会啃下这块最大的蛋糕?咱们一起走着瞧!











本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-6-7 16:19 , Processed in 0.093600 second(s), 9 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表