数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 30|回复: 0

[科技] 华为自研高带宽内存与昇腾950亮相,超大规模集群战略浮出水面

[复制链接]
发表于 昨天 18:38 | 显示全部楼层 |阅读模式
当英伟达和英特尔在硅谷上演“世纪联姻”之际,华为在深圳放出大招——用系统级创新打破单芯片性能壁垒,中国AI算力正在走出一条与众不同的道路。

在近日举行的华为Connect 2025大会上,这家中国科技巨头展示了一条雄心勃勃的硬件发展路线图。华为首次推出了自主研发的高带宽内存(HBM)与新一代昇腾AI加速器,这一组合明显透露出华为的竞争策略:不追求单芯片性能的绝对领先,而是通过系统级规模优势实现超越。

虽然单芯片性能仍落后于英伟达,但华为正在通过系统级解决方案展现竞争力。该公司确认将在2026年初推出昇腾950系列的两个版本:950PR型号配备约128GB自研HBM内存,提供约1.6TB/s的带宽;而950DT则将内存提升至144GB,带宽接近4TB/s。

一、技术规格深度解析:自研HBM的突破意义
华为此次推出的自研HBM内存标志着中国在高端存储技术领域取得重大突破。高带宽内存一直是AI加速器的关键组成部分,此前该技术主要由三星、SK海力士和美光等国际巨头垄断。

昇腾950PR的128GB内存配置已经达到业界先进水平,而950DT版本的144GB内存更是向行业顶尖水准看齐。内存带宽从1.6TB/s到4TB/s的跨越,意味着数据处理速度将获得显著提升,这对于训练大规模AI模型至关重要。

华为还勾勒了更长远的产品路线图,计划在2027年和2028年分别推出昇腾960和昇腾970设备,承诺提供更大的聚合内存容量、更高的互连带宽以及对FP8精度格式的更广泛支持。

二、集群战略:用规模换性能的独特路径
华为的竞争策略围绕高密度封装和激进网络互连展开,而非单纯追求单芯片性能。该公司展示了基于昇腾950单元的超级节点(SuperPoD),并描述了由这些构建块组成的超级集群(SuperCluster)。

这些超级集群采用全新的灵渠(Lingqu)互连协议和光学链路,旨在将数十万张加速卡连接在一起。华为宣布,基于昇腾950单元的Atlas 950超级节点将于2025年第四季度面世,目标是实现百亿亿级(exascale)FP8工作负载处理能力。

未来的Atlas 960集群将进一步增加芯片数量和吞吐量。华为最大的超级集群将提供惊人的524 ExaFLOPS的FP8计算能力,以及整整1 ZettaFLOP的FP4计算能力。

三、超级集群的规模与架构
华为超级集群的实现依赖于64个Atlas超级节点,总共容纳高达524,288个加速器。单个这样的系统可以支持多个AI实验室的训练和推理任务。

目前西方正在开发的最大集群是xAI的Colossus 2,它将使用超过55万个英伟达GB200和GB300 GPU。华为设计的规模现在已经可以与英伟达及其合作伙伴实现的最佳方案相媲美。

这种超大规模集群的构建能力,展现了华为在系统级工程设计上的深厚积累。从芯片互连到机架布局,从散热解决方案到电力分配,每一个环节都需要精心设计和优化。

四、东西方不同的AI发展路径
华为的策略基于一个简单的理念:如果能够自主掌握内存和网络技术,并且系统能够扩展到单个机架之外,那么聚合吞吐量可以弥补他们与英伟达、AMD等西方芯片制造商在芯片级别的差距。

如果这些超级集群按承诺实现,可能会迫使数据中心运营商重新思考在单芯片效率和大规模集群性能之间的权衡。对于国内部署而言,中国的电网可以承受更大的负载,并且能够承受一些额外的电力消耗来获得更多的AI计算性能。

基于美国的数据中心和AI集群通常受到电力限制,因此很难创建大规模系统,只有少数例外。相比之下,中国有足够的电力保障,这为超大规模AI集群的建设提供了基础设施优势。

五、技术创新的系统级思维
华为的这种系统级思维反映了中国科技企业在面临外部技术限制时的创新应对方式。当单一组件可能受到限制时,通过系统级优化和架构创新来实现整体性能的提升。

这种思路不仅体现在硬件设计上,也贯穿于华为的软件生态建设。从底层芯片到上层应用,华为正在构建一个完整的AI计算生态系统。

昇腾处理器与自研HBM内存的深度集成,使得华为能够在内存带宽和延迟方面进行针对性优化,这种软硬件协同设计的能力正是系统级创新的核心。

六、全球AI算力竞争的新格局
华为的超级集群战略正在重塑全球AI算力竞争的格局。传统上,AI计算性能的竞争主要集中在单芯片性能指标上,但华为正在通过集群级性能重新定义竞争规则。

这种转变意味着AI基础设施的竞争正在从单纯的硬件性能竞争,转向系统集成能力、能源效率、总体拥有成本等更全面的维度。

对于AI研究和应用社区来说,这种超大规模计算能力的可获得性将加速大型AI模型的开发和应用,可能会推动整个AI领域向更大规模、更复杂的方向发展。

七、产业化应用前景
华为的超大规模集群不仅面向科研和大型互联网企业,也着眼于更广泛的产业化应用。通过提供如此大规模的计算能力,华为正在为各行业的AI转型提供基础设施支撑。

从自动驾驶模型的训练到药物发现,从天气预报到金融风险分析,这种规模的计算能力将开启许多此前无法实现的应用场景。

华为的集群设计还考虑了多租户需求,单个系统可以支持多个AI实验室同时工作,这提高了资源利用效率,降低了使用门槛。

华为Connect 2025大会传递出的信息再清晰不过:在全球AI算力竞赛中,中国企业正在选择一条与众不同的道路。不追求单点技术的极致性能,而是通过系统级创新和规模优势实现整体突破。

华为自研HBM内存与昇腾950的组合,加上超大规模集群战略,展现了中国科技企业在面临外部环境变化时的适应能力和创新活力。这种以系统级思维应对技术挑战的方式,可能会为整个行业带来新的发展思路。

随着2026年昇腾950的正式推出,以及后续系列产品的陆续面世,全球AI计算市场将迎来更加多元化的竞争格局。超大规模集群是否真的能够改变AI计算的经济学,让我们拭目以待。









本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-9-20 02:42 , Processed in 0.093600 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表