|
近日外媒报道称,华为新一代昇腾910D人工智能处理器已完成初期研发,目标在单芯片性能上超越英伟达H100,并通过集群化部署对标英伟达新一代Blackwell和Rubin架构产品。这款专为AI训练设计的国产芯片预计将于5月下旬交付首轮测试样品,首批合作伙伴包含多家国内科技企业。
据公开数据显示,昇腾910D较前代910C将有重大革新。当前量产的910C双模块组合提供780BF16 TFLOPS算力,而英伟达H100的BF16性能可达2000 TFLOPS。为实现同等算力水平,华为需重新设计芯片架构并增加计算单元密度。技术人士指出,昇腾910D若采用多芯堆叠方案,或能通过规模化部署弥补单芯性能差距。
供应链信息显示,即将于下月批量出货的昇腾910C由台积电代工制造,但关于910D的生产路径尚存疑问。自2020年美国实施技术封锁以来,华为持续尝试突破7nm及以下制程限制。目前业界关注中国本土企业中芯国际能否为昇腾910D提供先进封装解决方案。
在系统级对比中,华为已推出集成384颗昇腾910C的CloudMatrix 384集群。该方案虽能在特定场景对标英伟达GB200 NVL72服务器,但整机能耗高出数倍——前者包含五倍于后端的处理器数量,且每瓦性能仅为英伟达方案的20%。
面对2026年英伟达Rubin架构GPU的竞争压力,昇腾910D将面临更严峻挑战。Rubin基于台积电N3工艺的FP8训练性能预计达8300 TFLOPS,BF16模式亦有4150 TFLOPS,较当前B200实现翻倍提升。不过受出口管制影响,Rubin产品线难以进入中国市场,这为华为保留了关键发展窗口。
产业分析师指出,昇腾处理器的战略价值在于构建自主AI生态。尽管能效存在短板,但通过超大规模部署(如万台级数据中心),国产芯片集群可平衡单卡性能差距。目前制约因素主要在于产能——中国大陆需要建立完整的半导体产业链,或通过第三方合作解决先进制程供给问题。
技术资料显示,昇腾910D将继承华为在分布式计算领域的技术积累,其互联架构支持数千芯片协同工作。配合即将推出的Atlas 900 SuperCluster系统,该芯片或成为中国AI基础设施的核心算力载体。不过要实现全球竞争力,华为仍需在芯片架构设计与制造工艺方面实现双重突破。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|