数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 1365|回复: 2

[电子] 我国最新申威 SW20610-Pro 处理器展示,新一代超算同步亮相

[复制链接]
发表于 2023-11-26 20:02:03 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
SC (International Conference for High Performance Computing, Networking, Storage, and Analysis) 是高性能计算,体系结构领域顶级会议。
在刚刚举行的 SC23 上,我国向世界展示了全新的申威 SW26010-Pro 处理器,性能比上一代提高了四倍。这是我国采用自主指令集(基于 Alpha 进行扩展),具有完全自主知识产权的处理器系列产品。
据介绍,基于申威 SW26010 处理器的神威太湖之光目前在 Top 500 超算榜单中排名第 11 名,而使用新处理器的超级计算机则排在第二名,仅次于美国橡树岭国家实验室的 Frontier。
▲ SC23 PPT,图源:Rongfen Lin
SW26010-Pro 由 6 个核心组和 1 个协议处理单元(PPU)构成,每个核心组包含 64 个计算处理元素,总计 384 个内核,相比下 SW26010 只有 4 个核心组。
此外,它支持的内存控制器也已经从 DDR3 升级到 DDR4-3200;而且每个核心组都有自己的内存控制器,配备 16 GB 内存,理论带宽达 307.2 GB/s。一个芯片能访问 96 GB 主内存,相比 SW26010 的 32 GB 实现了显著提升。
据 Chips and Cheese 称,SW26010 Pro C 拥有比前代产品更快的运行速度(CPE 频率为 2.25 GHz,MPE 频率为 2.10 GHz,前代产品仅 1.45 GHz),再加上全新 64 位 RISC 微架构和系统架构的改进,其 FP64 计算吞吐量也增加了四倍以上。
数据显示,每颗 SW26010 Pro 的最大 FP64 吞吐量为 13.8 TFLOPS。从理论计算吞吐量的角度来看,新型超级计算机十分强悍。虽然 SW26010-Pro 在节点级别与 Fugaku A64FX 相似,但我们的超级计算机可以在使用更少芯片的同时提供更高的 FP64 吞吐量。IT之家汇总数据对比如下:
CPU计算核心FP64FP32SW26010-Pro38413.8 TFLOPS27.6 TFLOPSSW260102562.9 TFLOPS5.8 TFLOPSA64FX483 TFLOPS6 TFLOPSMI250X (单 GCD)11023.9 TFLOPS23.9 TFLOPS | 47.8 TFLOPS (packed)
不过,它的内存带宽未能与计算吞吐量相匹配,因此内存带宽成为了它的性能瓶颈。
SW26010-Pro 试图通过将缓存容量增加到 256 KB(SW26010 为 64 KB)来解决问题,但在缺乏适当的 L2 缓存的情况下,每个 CPE 只有 256KB 的缓存明显是不够的,因此两个处理器仍然存在主要的性能瓶颈。同时,一个双通道 DDR4-3200(51.2 GB/s)的内存子系统对于拥有 512 位向量 FPU、每周期最高可达 16 FP64 FLOPS 的 64 核处理器来说也非常不够用。
超算系统节点HPL-MxP 性能(Eflop/s)理论 FP64 吞吐量 (Pflop/s)
新一代神威107,136 申威 SW26010-Pro5.0481,481.05神威・太湖之光40,960 申威 SW26010?121.6富岳158,976 A64FX2537.21Frontiers9,408(64c AMD 霄龙 7A53 + 4x AMD MI250X)9.95071,821.84
(仅 GPU 为 1,679.62)

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-7-21 22:44 , Processed in 0.171600 second(s), 10 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表