|
各位数字航海家们,注意了!就在咱们埋头刷手机的时候,英特尔悄咪咪在服务器战场扔了块“内存怪兽积木”——代号“新月岛”(Crescent Island)的数据中心GPU。这玩意儿不搞图形渲染,专攻AI推理,肚子里塞了160GB内存,活像给AI模型造了个海量记忆宫殿!
一、拆箱:当GPU成了“推理特长生”
周二官宣的这颗“新月岛”,本质上是个“偏科生”。别人家GPU既要游戏又要挖矿,它倒好,直接挂牌“推理工作室”,把160GB LPDDR5X内存焊在板上,功耗还压得挺低。这操作好比给AI推理任务配了辆专属货运卡车——不拼颜值不竞速,但装货量管够。
为啥非要专攻推理?得唠唠AI产业链的“流水线”。训练AI像造汽车原型,推理则是4S店交车——后者要的是稳定、省电、大规模部署。如今ChatGPT们天天应对全球提问,背后正是成千上万张“推理卡”在烧电。英特尔这回押注的,正是这片蓝海。
二、内存迷宫:160GB背后的数学题
160GB是什么概念?目前消费级显卡顶配也就24GB,这货直接翻了近7倍!但蹊跷在于:LPDDR5X内存芯片单颗最大32GB,双通道设计(总位宽32bit)。要凑够160GB,得码齐20颗芯片。
问题来了:20颗芯片怎么接?英特尔摆出两道谜题:
方案A:造个“巨无霸GPU”,配640位超宽内存接口(相当于20车道高速公路),一口气吞下所有内存;
方案B:塞两颗GPU,各管10颗内存,位宽降至320bit(类似双车道并行)。
但技术宅们发现盲点:LPDDR5X不支持GDDR6/7的“蝴蝶模式”,没法用单320bit接口串联20颗芯片。所以方案B更靠谱——既避免造出核弹级大核心,又符合英特尔“风冷企业服务器”的定位。
三、架构彩蛋:和笔记本芯片是亲戚
“新月岛”用的Xe3P架构,其实是笔记本芯片Panther Lake(酷睿Ultra 300系列)里Xe3架构的“满血版”。换句话说,这货和明年你可能买到的轻薄本显卡是表亲!英特尔强调它支持“丰富数据类型”,明摆着针对云服务商的大模型量化需求(比如INT8、FP16计算)。
可惜性能数据还在保密期,但160GB内存暗示了野心:足同时加载多个百亿参数模型,或者单个体积巨大的科学计算模型(比如气候模拟、蛋白质结构预测)。这波操作,堪称“给AI推理发了一张无限畅饮卡”。
四、上市节奏:2026年才露真容
英特尔计划2026年下半年送样,目前已有工程版。想蹲实测性能?今年底的OCP开放计算项目峰会或SC25超算展可能是“爆料窗口”。时间线拉这么长,估计是要和英伟达的B系列推理卡、AMD的CDNA4架构打持久战。
结语:推理赛道的“内存技术竞赛”开始了
当AI从“炼模型”转向“用模型”,推理芯片成了新战场。英特尔这招“内存碾压术”,像极了格斗游戏里放弃连招、专注堆血条的玩家——未必最炫酷,但可能最耐打。至于它能否在英伟达的CUDA生态墙上凿出缺口,还得看软件栈的实战表现。但无论如何,服务器机柜里的暗战,可比显卡跑分有意思多了……
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|