数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 244|回复: 1

[科技] 中科曙光正式公布scaleX万卡超集群:每节点640卡、总算力超500亿亿次

[复制链接]
发表于 2025-12-23 14:43:32 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
快科技12月22日消息,对高算力无限渴求的AI时代,最关键的已经不是单卡性能,而是尽可能高效地堆叠足够多的加速卡,构成庞大的集群。
除了NVIDIA、AMD,国产厂商也正在这方面全力突破,华为、摩尔线程、中科曙光等都是突出代表。
近日,中科曙光正式发并展示了scaleX万卡超级群,这也是国产万卡基AI集群的首次真机亮相。
不同于华为封闭式的全自研集群,中科曙光scaleX万卡超集群旨在构建开放、兼容、高密度的超大规模算力基础设施。
它支持多品牌加速卡、主流计算生态,已经适配优化400多个主流大模型、世界模型等,可用于大模型训练、金融风控、地质能源勘探、科学智能等各种场景。
中科曙光scaleX万卡超集群由多个scaleX640超节点(单机柜640卡)、scaleFabirc高速网络互连而成,总计拥有10240块加速卡,总算力超过5EFlops(500亿亿次每秒)。
HBM内存总容量超过650TB,总带宽超过18PB/s;片间互连总带宽超过4.5PB/s,柜间互连总带宽超过500TB/s。
单个超节点的基本构成是千卡级计算单元,采用“一拖二”高密架构设计,实现单机柜640卡超高速一致性互连,双计算柜则组成1280卡计算单元。
散热方面,采用超高速正交架构、超高密度刀片、浸没相变液冷、高压直流供电等多技术融合创新设计,成为业界超高集成度的液冷超节点。
全浸没式相变液冷技术,将服务器完全浸在特制液体中,中间液体冷凝换热装置CDM的散热能力高达1.72MW(兆瓦)。
单机柜算力密度相比业界其他超节点最大提升20倍,PUE值低至1.04。
公开信息显示,中科曙光子公司曙光数创拥有139项液冷相关专利,是国内唯一实现大规模商业化液冷部署的企业。
网络方面,中科曙光自研的scaleFabric网络芯片可提供400Gb/s的超高带宽、低于1微秒的端侧通信延迟、260ns的交换芯片转发延时,超节点间的通信性能达到业内先进水平,相比传统的InfiniBand网络提升2.33倍。
基于面向大规模组网优化的网络协议、超高交换容量的网络芯片、极致的链路可靠性优化,集群规模得以扩展到10万卡以上,同时网络总体成本降低30%。
优化方面,超级隧道设计实现了芯片级、系统级、应用级的三级协同优化,通过BurstBuffer、XDS等技术,大模型训推效率提升30-40%,GPU利用率提升最多55%,同时还有AI应用亲和、AI数据加速。
可靠性方面,一体化、智能化的集群管控,可大大提高MTBF(平均故障间隔时间)、降低MTTR(平均故障修复时间),集群长期可用性达到99.99%,平均每30天的不可用时间小于4分钟。
            


发表于 2025-12-23 16:26:38 | 显示全部楼层
游客请登录后查看回复内容
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2026-4-2 22:44 , Processed in 0.312000 second(s), 12 queries , Gzip On, Redis On.

Powered by Discuz!

© MyDigit.Net Since 2006

快速回复 返回顶部 返回列表