数码之家

 找回密码
 立即注册
搜索
查看: 591|回复: 1

[产品] 英伟达顶级Blackwell芯片内部结构图首曝,设计复杂难以仿制

[复制链接]
发表于 2025-1-27 20:01:47 | 显示全部楼层 |阅读模式
本帖最后由 土耳鸡烤鸡 于 2025-1-27 20:29 编辑

近日,硬件分析师Kurnal与华硕中国区总经理俞元麟在B站发布视频,共同揭秘了英伟达下一代旗舰显卡RTX 5090所搭载的GB202“Blackwell”芯片的标注版结构图,详尽展现了这款全新架构的物理布局细节。

从这张曝光的结构图中,我们可以清晰看到GB202芯片采用了中央集中式的精妙设计,核心区域赫然集成了高达128MB的二级缓存(而在RTX 5090上,实际启用的缓存量达到了96MB,展现了其设计的灵活性与实用性)。芯片的外围,12组图形处理集群(GPC)环绕排列,每个GPC又内含8个纹理处理集群(TPC),而每个TPC则进一步融合了16个流式多处理器(SM)。这些SM紧密协作,共同构成了由192个SM组成的庞大CUDA核心阵列,总数多达24,576个。值得注意的是,RTX 5090实际“解锁”并投入运用的CUDA核心数量为21,760个,而完整版芯片或将成为专业工作站显卡的专属之选。

在芯片的顶部、左侧和右侧边缘,8组64位内存控制器有序布局,它们携手共筑了512位GDDR7显存接口,为显卡提供了澎湃的数据吞吐能力。SM单元则采用了独具创新的四分区架构,每组均配备128KB L1缓存和4个纹理映射单元(TMU),内部还集成了独立寄存器文件、L0指令缓存、线程束调度器等核心模块,确保SM单元能够高效、稳健地运行。

垂直贯穿芯片中轴的媒体处理区,NVENC编码器与NVDEC解码器并肩矗立。在RTX 5090上,将启用4组NVENC中的3组以及4组NVDEC中的2组,为显卡赋予了强大的视频编解码能力。而芯片的底部,则巧妙集成了PCIe 5.0 x16接口与显示控制器,为显卡与系统的无缝对接提供了高速、稳定的传输通道。

尽管GB202芯片拥有着惊人的192个RT核心、768个Tensor核心与768个纹理单元的豪华阵容,但其芯片面积却巧妙地控制在英伟达前代GH100/GV100(814平方毫米以上)之下。更为引人注目的是,每个SM单元均内置了第五代Tensor核心与第四代RT核心,这些专用硬件与新增的12组光栅引擎/3D FF模块相互协同,共同铸就了Blackwell架构的性能之基,为RTX 5090带来了前所未有的性能飞跃。







本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
发表于 2025-3-20 20:43:34 | 显示全部楼层
肯定是独家设计的啦!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-21 22:59 , Processed in 0.124800 second(s), 11 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表