|
玩电脑硬件的朋友最近可能听说了,英伟达(NVIDIA)的旗舰显卡GeForce RTX 5090啊,在干视频剪辑、做3D渲染这类创意工作的时候,可能没法完全使出全力。问题出在哪儿呢?根子在于那个连接显卡和主板的PCIe通道(PCIe带宽)。要是这通道不够宽(带宽不足),显卡性能掉个25%都有可能!
这事儿是搞专业工作站的Puget Systems(普吉特系统)测试发现的。他们专门拿RTX 5090做了系列实验,换着花样试不同的PCIe版本(像5.0、4.0、3.0)和通道数(比如x16、x8、x4),就为了看看它们对各种创意软件干活速度的影响。
回想RTX 5090刚发布那会儿,TechPowerUp的测试就点出过,这可是第一款顶级显卡用上了PCIe 5.0 x16接口。这个接口厉害在哪?它能提供双向64 GB/s的数据传输速度!比上一代老旗舰RTX 4090在PCIe 4.0 x16接口下的32 GB/s速度快了整整一倍。但普吉特这次实际跑下来发现,要是PCIe通道给窄了,性能损失还真不小,最高能达到25%。他们就是专门检验这个接口在实际干活中,特别是在视频编辑工作流里,如果通道数不足或者用了老版本接口会咋样。
具体看测试结果:
在达芬奇(DaVinci Resolve)里面导出视频:
用PCIe 5.0 x16、PCIe 5.0 x8或者PCIe 4.0 x16,花的时间基本一样快。
降到PCIe 5.0 x4、PCIe 4.0 x8或者PCIe 3.0 x16这档,导出就稍微慢点了,慢了大约10%。
带宽再往下降,用PCIe 4.0 x4或者PCIe 3.0 x8,那就真卡了,导视频时间得延长25%左右。
在特效软件After Effects里:
带宽只要别掉得太厉害,低于每秒8 GB(8 GB/s) 才开始看到一点点的速度影响。
用虚幻引擎5.5(Unreal Engine 5.5)搞虚拟制作:
当通道数最低的时候,画面平均每秒显示的帧数(平均帧率)会掉个7%左右。
也有不受影响的:
Blender离线渲染和OctaneBench跑分,速度基本没变化。
跑Llama(一种大语言模型) 的测试,也看不出跟PCIe速度有啥关系。
从技术上来说呢,RTX 5090用的PCIe 5.0,底层信号传递方式跟PCIe 4.0是一样的(都是NRZ),但是加强了信号稳定性的措施,比如用了决策反馈均衡(DFE) 和更严格的时序控制。虽然它自己能完全适应老的PCIe 4.0、3.0甚至更老的主板(向下兼容),但它本身潜力(巨大的带宽空间)这么猛,就带来个问题:装在老主板(旧插槽)上,或者跟高速NVMe固态硬盘共享通道(分走了一些通道) 的时候,性能到底会被拖累多少?
普吉特这测试其实也点出了现在许多主板的通病:大多数板子只有一个插槽能给显卡提供完整的x16条通道。这就意味着,只要你多插了一个设备(比如高速固态硬盘),那显卡和这些设备可能都得在x4或者x8这么窄的通道下工作。
结果就是:你花大价钱买了块RTX 5090旗舰显卡,它很可能默默地在PCIe 4.0 x4这么慢的通道上跑着。这对专业干活的人(专业人员)影响就大了,特别是处理高分辨率时间线或者复杂3D场景的项目,活儿干完的时间(项目周转时间)就得多等不少。
所以啊,给需要装多显卡配置的工作室或者高端玩家提个醒:打算上RTX 5090这种卡王,千万确认好它装在的那个插槽,能给它跑满带宽(全速通道)!否则钱就白花了,力气也使不出了。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|