|
今儿个咱们聊点有“时差”的科技新闻——不是说消息过时,是这东西本身就得等两年才能摸到!就在今天,英特尔突然把一张名为“新月岛”(Crescent Island)的数据中心GPU牌甩到桌上。别看老黄和苏妈在AI芯片战场打得火热,这位蓝色巨人默默憋了个专攻AI推理的大招:160GB显存、风冷散热、还能扛住千亿参数大模型。不过等等,这玩意儿要等到2026年才给样品,2027年正式铺货……这预热周期长得简直像在提前预订未来两年的科技头条!
先给这芯片验明正身。人家大名Crescent Island,架构用的是英特尔下一代Xe3P(代号“天体”)。别看架构名字取得这么星空漫游,干的可是最接地气的活儿——专门伺候AI推理场景。英特尔这次绝口不提什么拳打训练、脚踢渲染,就死磕两个点:每瓦性能、总拥有成本。这思路很清晰了,就是对着企业采购经理的预算表喊话:电费我帮你省,机房空调我照旧能用风冷!
但真正让人瞳孔地震的是那个显存容量。160GB的LPDDR5X!现在市面上那些常见的AI加速卡,塞个80GB就算大胃王了,英特尔这一出手直接容量翻倍。好比别人还在用厢式货车运模型,他们直接开来了带起重机的半挂卡车。这种容量可不是为了跑分好看,分明就是冲着那些参数规模飙到千亿级别的LLaMA、ChatGLM之类大模型去的。以后部署超大规模AI模型,可能真不用再折腾模型切分这种技术活了。
不过这里有个技术细节特别有意思。它用的不是显卡上常见的GDDR显存,而是手机笔记本爱用的LPDDR5X。这种内存最大优势就是省电,但通常位宽比较窄(16位双通道)。要实现160GB容量,英特尔要么把内存接口做到640位这种夸张宽度,要么就是塞了两颗GPU芯片玩叠加。而且这种内存有个特性:玩不了GDDR6/7那种“蝴蝶连接”的高端操作。说白了就是为省电做了点性能取舍。
时间线方面英特尔画了个超长饼:2026年下半年才开始给主要客户送样,大规模上市要等到2027年。这时间跨度长得足够AMD的MI450系列和英伟达的Vera Rubin架构产品都迭代一轮了。但英特尔显然也没干等着,他们现在正用现有的Arc Pro B系列显卡打磨软件栈,特别是那个开源驱动,就为了到时候能让Xe3P架构彻底放飞自我。
说起来英特尔在独立GPU领域算是后来者,但这次选赛道选得很刁钻。当英伟达在AI训练领域一骑绝尘,AMD在训练推理两头抓时,英特尔直接押注AI推理市场。这个市场有个特点——对长期成本敏感度极高。模型训练可能就花几个月,但模型上线后要7x24小时跑好几年,电费和硬件折旧都是难以忽视的开销。
这也是为什么他们特别强调风冷设计。现在很多高端AI芯片都要上液冷,虽然性能强劲但维护成本高。如果真能用传统风冷搞定,对那些想低调部署AI服务的公司来说,诱惑力不小。不过这一切都得等到2026年样品出来才能验证,现在都属于“画饼阶段”。
所以英特尔这步棋下得很妙:不和你拼峰值算力,转而追求能效和总拥有成本;不追求首发上市,而是慢慢打磨软件生态。等到2027年真正上市时,AI加速器市场说不定已经杀成红海,但那时候如果有张卡能同时解决电费和显存两大难题,说不定真能撬动市场格局。只不过这场好戏,我们至少还得等两年才能看到序幕拉开——到时候现在这批AI模型,估计都进化成超级智能了吧?
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|