|
本帖最后由 Meise 于 2025-1-30 06:56 编辑
TOP2 1月30日消息:AMD于当天凌晨公布新一代显卡AI推理性能数据,其旗舰型号RX 7900 XTX在DeepSeek R1大模型测试中呈现差异化竞争优势。根据官方披露,该显卡运行Qwen 7B蒸馏模型时,处理速度较英伟达RTX 4090提升13%,与RTX 4080 Super对比最高拉开34%差距。
测试采用多参数模型配置方案,在7B至14B参数范围内,RX 7900 XTX相较RTX 4090保持2%-13%性能优势,但在32B参数场景下以4%微弱差距落后。对比RTX 4080 Super时,性能领先幅度随模型复杂度增加从34%递减至22%。
技术文档显示,RDNA3架构集成192个专用计算模块,支持双精度浮点与整型混合运算。虽然该架构并非专为AI设计,但AMD近期推出《DeepSeek R1部署方案》,实现消费级硬件与大模型框架的深度适配。测试中采用的DeepSeek R1框架通过底层指令集优化,相较传统方案提升11倍运行效率,其创新性整合多厂商硬件加速指令。
市场研究数据显示,当前消费级显卡AI计算应用渗透率已突破17%,驱动硬件厂商加速架构升级。此次测试虽未启用TensorRT等专用加速引擎,但揭示出非专用架构的潜在计算效能。随着边缘计算需求增长,显卡厂商正面临架构设计与生态构建的双重挑战,技术路线差异或影响未来市场分布。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|