数码之家

 找回密码
 立即注册
搜索
数码之家 首頁 数智时代 查看内容

英伟达下一代显卡Blackwell芯片内部结构图曝光,设计复杂难以仿制 ...

2025-3-19 18:58| 发布者: 香瑶| 查看: 351| 评论: 1|原作者: 土耳鸡烤鸡

近日,硬件分析师Kurnal与华硕中国区总经理俞元麟在B站发布视频,共同揭秘了英伟达下一代旗舰显卡RTX 5090所搭载的GB202“Blackwell”芯片的标注版结构图,详尽展现了这款全新架构的物理布局细节。

从这张曝光的结构图中,我们可以清晰看到GB202芯片采用了中央集中式的精妙设计,核心区域赫然集成了高达128MB的二级缓存(而在RTX 5090上,实际启用的缓存量达到了96MB,展现了其设计的灵活性与实用性)。芯片的外围,12组图形处理集群(GPC)环绕排列,每个GPC又内含8个纹理处理集群(TPC),而每个TPC则进一步融合了16个流式多处理器(SM)。这些SM紧密协作,共同构成了由192个SM组成的庞大CUDA核心阵列,总数多达24,576个。值得注意的是,RTX 5090实际“解锁”并投入运用的CUDA核心数量为21,760个,而完整版芯片或将成为专业工作站显卡的专属之选。

在芯片的顶部、左侧和右侧边缘,8组64位内存控制器有序布局,它们携手共筑了512位GDDR7显存接口,为显卡提供了澎湃的数据吞吐能力。SM单元则采用了独具创新的四分区架构,每组均配备128KB L1缓存和4个纹理映射单元(TMU),内部还集成了独立寄存器文件、L0指令缓存、线程束调度器等核心模块,确保SM单元能够高效、稳健地运行。

垂直贯穿芯片中轴的媒体处理区,NVENC编码器与NVDEC解码器并肩矗立。在RTX 5090上,将启用4组NVENC中的3组以及4组NVDEC中的2组,为显卡赋予了强大的视频编解码能力。而芯片的底部,则巧妙集成了PCIe 5.0 x16接口与显示控制器,为显卡与系统的无缝对接提供了高速、稳定的传输通道。

尽管GB202芯片拥有着惊人的192个RT核心、768个Tensor核心与768个纹理单元的豪华阵容,但其芯片面积却巧妙地控制在英伟达前代GH100/GV100(814平方毫米以上)之下。更为引人注目的是,每个SM单元均内置了第五代Tensor核心与第四代RT核心,这些专用硬件与新增的12组光栅引擎/3D FF模块相互协同,共同铸就了Blackwell架构的性能之基,为RTX 5090带来了前所未有的性能飞跃。

nkXiPMTIEpMfBpTf.jpg

RmjWAbKuVUANqzzM.jpg

ix1dydvZR8K2HKvx.jpg

miFbXAVBzR7Y4U5J.jpg
2

路过

雷人

握手

鲜花

鸡蛋

刚表态过的朋友 (2 人)

相关阅读

发表评论

最新评论

引用 dcrew 2025-3-20 20:43
肯定是独家设计的啦!

查看全部评论(1)

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-1 14:37 , Processed in 0.218400 second(s), 16 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

返回顶部