数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 67|回复: 2

[科技] ​​英特尔亮出“新月岛”:专攻AI推理的巨型内存GPU架构探秘​

[复制链接]
发表于 7 小时前 | 显示全部楼层 |阅读模式
各位数字航海家们,注意了!就在咱们埋头刷手机的时候,英特尔悄咪咪在服务器战场扔了块“内存怪兽积木”——代号“新月岛”(Crescent Island)的数据中心GPU。这玩意儿不搞图形渲染,专攻AI推理,肚子里塞了160GB内存,活像给AI模型造了个海量记忆宫殿!

一、拆箱:当GPU成了“推理特长生”​​
周二官宣的这颗“新月岛”,本质上是个“偏科生”。别人家GPU既要游戏又要挖矿,它倒好,直接挂牌“推理工作室”,把160GB LPDDR5X内存焊在板上,功耗还压得挺低。这操作好比给AI推理任务配了辆专属货运卡车——不拼颜值不竞速,但装货量管够。

为啥非要专攻推理?得唠唠AI产业链的“流水线”。训练AI像造汽车原型,推理则是4S店交车——后者要的是稳定、省电、大规模部署。如今ChatGPT们天天应对全球提问,背后正是成千上万张“推理卡”在烧电。英特尔这回押注的,正是这片蓝海。

二、内存迷宫:160GB背后的数学题​​
160GB是什么概念?目前消费级显卡顶配也就24GB,这货直接翻了近7倍!但蹊跷在于:LPDDR5X内存芯片单颗最大32GB,双通道设计(总位宽32bit)。要凑够160GB,得码齐20颗芯片。

问题来了:20颗芯片怎么接?英特尔摆出两道谜题:
方案A​​:造个“巨无霸GPU”,配640位超宽内存接口(相当于20车道高速公路),一口气吞下所有内存;
​​方案B​​:塞两颗GPU,各管10颗内存,位宽降至320bit(类似双车道并行)。

但技术宅们发现盲点:LPDDR5X不支持GDDR6/7的“蝴蝶模式”,没法用单320bit接口串联20颗芯片。所以方案B更靠谱——既避免造出核弹级大核心,又符合英特尔“风冷企业服务器”的定位。

三、架构彩蛋:和笔记本芯片是亲戚​​
“新月岛”用的Xe3P架构,其实是笔记本芯片Panther Lake(酷睿Ultra 300系列)里Xe3架构的“满血版”。换句话说,这货和明年你可能买到的轻薄本显卡是表亲!英特尔强调它支持“丰富数据类型”,明摆着针对云服务商的大模型量化需求(比如INT8、FP16计算)。

可惜性能数据还在保密期,但160GB内存暗示了野心:足同时加载多个百亿参数模型,或者单个体积巨大的科学计算模型(比如气候模拟、蛋白质结构预测)。这波操作,堪称“给AI推理发了一张无限畅饮卡”。

四、上市节奏:2026年才露真容​​
英特尔计划2026年下半年送样,目前已有工程版。想蹲实测性能?今年底的OCP开放计算项目峰会或SC25超算展可能是“爆料窗口”。时间线拉这么长,估计是要和英伟达的B系列推理卡、AMD的CDNA4架构打持久战。

结语:推理赛道的“内存技术竞赛”开始了​​
当AI从“炼模型”转向“用模型”,推理芯片成了新战场。英特尔这招“内存碾压术”,像极了格斗游戏里放弃连招、专注堆血条的玩家——未必最炫酷,但可能最耐打。至于它能否在英伟达的CUDA生态墙上凿出缺口,还得看软件栈的实战表现。但无论如何,服务器机柜里的暗战,可比显卡跑分有意思多了……

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
发表于 7 小时前 | 显示全部楼层
英特尔亮出“新月岛”:专攻AI推理的巨型内存GPU架构探秘
回复 支持 反对

使用道具 举报

发表于 6 小时前 | 显示全部楼层
已经看了华为384节点,效率比其他的方案好太多
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-10-15 15:12 , Processed in 0.093601 second(s), 9 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表