|
各位数码爱好者注意啦!这次英伟达的新旗舰显卡RTX 5090和RTX PRO 6000摊上事儿了!这段时间爆出一个让人哭笑不得的bug——这俩显卡在用着用着的时候会突然"装死",怎么叫都叫不醒,非得把电脑电源拔了重插才能恢复正常!
这事儿最先是被云服务商CloudRift捅出来的。他们在实际生产环境里被这个bug折腾得够呛,最后实在没辙了,干脆公开悬赏1000美元,向全球技术大神求助解决方案。要说这个bug有多奇葩?简单来说就是当这些新显卡用在虚拟机环境里的时候,关机或者重新分配显卡时会触发一个叫做"PCIe功能级重置"的标准流程,结果显卡撂挑子现场表演"躺平"大戏。
系统日志里会留下"FLR后65535毫秒未就绪;放弃尝试"的提示,这时候连查看硬件信息的lspci命令都懵圈了,显示报错消息"未知头类型7f"。AI创业公司Tiny Corp也在社交媒体上吐槽:"5090和PRO 6000是不是有硬件缺陷啊?我们查了半天都找不到解决办法。"
这个吐槽很快就引爆了各大技术社区,Proxmox论坛和Level1Techs上好多用户都跳出来说遇到了同样的问题。有个老哥诉苦说:"Windows虚拟机关机后我的主机立马凉凉,重启系统都没用。"另一个用户更倒霉:"我之前用4080屁事没有,换了5090就彻底翻车。"
现在最麻烦的是,这个问题好像就是Blackwell架构的特产,之前的4090啥的都没这毛病。而且调整PCIe设置什么的根本不管用,这就很尴尬了。要说这个FLR功能绝不是什么可有可无的东西,它在虚拟化环境里超级重要,能让显卡在不同虚拟机之间安全切换。现在这个功能掉链子,搞得多租户AI应用和家用虚拟化实验室都瑟瑟发抖——毕竟一张显卡崩了可能带着整个服务器一起陪葬。
CloudRift现在也是急得不行,全网开出1000美元悬赏找解决方案。不过英伟达这边倒是淡定得很,到现在都没正式承认这个问题,也没给出任何临时解决方案。所以现在的情况就是:用户花大价钱买了最新显卡,结果可能要在机箱上贴个纸条写着"遇到问题请立即拔电源",这画面想想也是挺魔幻的。
建议最近想入手新显卡的老铁们还是再观望观望,等官方给出明确解决方案再说。毕竟谁也不想花那么多钱买个需要"重启大法"才能用的显卡对吧?咱们还是坐等英伟达拿出真正的解决方案,看看这出戏最后怎么收场!
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|