华为昇腾910D处理器发布瞄准英伟达Blackwell与Rubin架构

Meise · 发表于昨天 07:58

近日外媒报道称，华为新一代昇腾910D人工智能处理器已完成初期研发，目标在单芯片性能上超越英伟达H100，并通过集群化部署对标英伟达新一代Blackwell和Rubin架构产品。这款专为AI训练设计的国产芯片预计将于5月下旬交付首轮测试样品，首批合作伙伴包含多家国内科技企业。

据公开数据显示，昇腾910D较前代910C将有重大革新。当前量产的910C双模块组合提供780BF16 TFLOPS算力，而英伟达H100的BF16性能可达2000 TFLOPS。为实现同等算力水平，华为需重新设计芯片架构并增加计算单元密度。技术人士指出，昇腾910D若采用多芯堆叠方案，或能通过规模化部署弥补单芯性能差距。

供应链信息显示，即将于下月批量出货的昇腾910C由台积电代工制造，但关于910D的生产路径尚存疑问。自2020年美国实施技术封锁以来，华为持续尝试突破7nm及以下制程限制。目前业界关注中国本土企业中芯国际能否为昇腾910D提供先进封装解决方案。

在系统级对比中，华为已推出集成384颗昇腾910C的CloudMatrix 384集群。该方案虽能在特定场景对标英伟达GB200 NVL72服务器，但整机能耗高出数倍——前者包含五倍于后端的处理器数量，且每瓦性能仅为英伟达方案的20%。

面对2026年英伟达Rubin架构GPU的竞争压力，昇腾910D将面临更严峻挑战。Rubin基于台积电N3工艺的FP8训练性能预计达8300 TFLOPS，BF16模式亦有4150 TFLOPS，较当前B200实现翻倍提升。不过受出口管制影响，Rubin产品线难以进入中国市场，这为华为保留了关键发展窗口。

产业分析师指出，昇腾处理器的战略价值在于构建自主AI生态。尽管能效存在短板，但通过超大规模部署（如万台级数据中心），国产芯片集群可平衡单卡性能差距。目前制约因素主要在于产能——中国大陆需要建立完整的半导体产业链，或通过第三方合作解决先进制程供给问题。

技术资料显示，昇腾910D将继承华为在分布式计算领域的技术积累，其互联架构支持数千芯片协同工作。配合即将推出的Atlas 900 SuperCluster系统，该芯片或成为中国AI基础设施的核心算力载体。不过要实现全球竞争力，华为仍需在芯片架构设计与制造工艺方面实现双重突破。

账号		自动登录	找回密码
密码			立即注册

[电子] 华为昇腾910D处理器发布瞄准英伟达Blackwell与Rubin架构

本帖子中包含更多资源

相关帖子

浏览过的版块

[电子] 华为昇腾910D处理器发布 瞄准英伟达Blackwell与Rubin架构

本帖子中包含更多资源

相关帖子

浏览过的版块

[电子] 华为昇腾910D处理器发布瞄准英伟达Blackwell与Rubin架构