|
本帖最后由 Meise 于 2025-2-4 07:23 编辑
人工智能算力竞赛再掀波澜,显卡巨头间的技术角力进入新阶段。继AMD上周公布Radeon RX 7900 XTX在DeepSeek基准测试中超越英伟达上代旗舰RTX 4090后,英伟达近日首度披露基于Blackwell架构的RTX 5090测试数据,以碾压性优势回应竞争对手的挑战。这场围绕AI性能的隔空交锋,不仅揭示了新一代显卡的技术跃进,更凸显出两家厂商在测试方法论上的微妙差异。
根据英伟达官方演示资料,在Llama-bench平台采用int4量化精度的测试环境下,搭载7B参数模型时,AMD旗舰显卡RX 7900 XTX的运算速度为每秒生成约100个token。相较之下,前代RTX 4090展现出46%的性能优势(约150 token/秒),而全新RTX 5090更是实现103%的速度提升,达到每秒200个token的处理能力。当模型规模扩展至8B参数时,三款显卡的性能差距基本维持相同比例。
在32B超大参数模型的极端测试场景中,RTX 5090的算力优势进一步放大至124%,以每秒50个token的运算速度大幅领先对手。需要特别说明的是,两家厂商的测试标准存在差异——AMD此前对比测试选用的是上代次旗舰RTX 4080 Super,而英伟达此次则着重强调其最新架构的跨越式进步。不过行业专家提醒,此类厂商自测数据通常存在特定优化倾向,实际表现还需等待第三方机构验证。
从技术细节分析,RTX 5090的强势表现得益于Blackwell架构的全新计算单元设计,其Tensor Core矩阵运算效率较Ada Lovelace架构有显著提升。而AMD显卡虽然在传统图形渲染领域保持竞争力,但在需要大量并行计算的AI工作负载中,仍面临显存带宽与计算管线协同效率的挑战。值得关注的是,双方测试均未披露散热方案、功耗墙设置等可能影响性能释放的关键参数,这为客观评估设备真实能力留下探讨空间。
随着生成式AI应用场景的快速扩展,显卡的通用计算能力正成为衡量产品价值的重要维度。此次曝光的测试数据虽存在一定局限性,但清晰展现出新一代GPU在AI加速领域的技术代差。硬件爱好者正密切关注即将到来的第三方评测,期待看到这两大显卡阵营在统一测试标准下的真实较量。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|