数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 51|回复: 1

[科技] 软银给AMD AI芯片搞“隔间术”,一块GPU当八块用?

[复制链接]
发表于 6 天前 | 显示全部楼层 |阅读模式
哎,各位搞AI的、蹲实验室的、还有云服务器背后天天跟算力搏斗的兄弟们,来听听这个事儿,特别有意思!现在一说AI算力,大家脑子里是不是“唰”一下蹦出那个绿油油的Logo——对,就是NVIDIA,特别是他们家那个Blackwell架构一出来,简直把数据中心都刷成绿光了。那AMD呢?它的Instinct系列AI加速卡,在那些超大规模云计算公司(就是咱们说的Hyperscaler)那儿,好像总有点“既生瑜何生亮”的意思,不是大家的首选方案。

但你别急,总有人不信邪,非要在这条路上趟出点名堂。这回站出来的,是软银(SoftBank)!对,就是那个投资过阿里巴巴、ARM,眼光又毒又敢砸钱的软银。他们最近干了件挺“极客”的事儿,在自家的技术博客上晒出了一个新玩法,目标直指怎么把AMD的GPU潜力给“榨干”,让它在AI活儿上变得更有用、更灵活。

他们搞了个啥呢?名字听起来挺玄乎,叫“Orchestrator”,你可以理解成一个“资源调度大师”或者“算力分配管家”。但这可不是普通的软件调度,软银是拉着AMD一起,深度开发了一个功能,核心秘诀叫做 “GPU分区”。

这“分区”是啥概念?我打个比方你就明白了。以前一块AMD Instinct GPU就像一个大开间,所有AI任务(比如训练大模型、推理小模型)都挤在这个大开间里干活,虽然算力强,但有时候难免互相干扰,资源分配也不够精细。现在软银这个“管家”来了,它手里有图纸,能把这一整个大开间,根据墙体的自然结构(也就是GPU的硬件模块),隔成好几个带独立卫生间和小厨房的单间!

这个能用来“隔墙”的硬件结构,就是AMD Instinct GPU里面的 Accelerator Complex Die,简称 XCD。一块GPU里面可能封装了好几个XCD。软银的“管家”就能以XCD为基本单位,进行灵活分割。

它有两种主要模式:
一种叫 SPX模式,就是把所有XCD合并起来,当成一个“超级大单间”用,全力处理一个超级大的任务。

另一种更酷,叫 CPX模式,最多可以把一块物理GPU,分割成八个独立的逻辑设备!这就好比把那个大开间,隔成了八个功能齐全的迷你工作室,每个工作室都能独立接活儿,跑一个不同的AI模型或者任务。

光分割处理器还不行,内存也得跟上。AMD这些高端GPU用的都是高带宽内存(HBM),容量大、速度快。软银这个“管家”同样能把这一整块高速内存池,像切蛋糕一样,划分成独立的HBM区域,分配给上面说的每一个“GPU单间”(也就是GPU实例)独享。这样就保证了每个任务不仅有自己专属的计算单元,还有自己专属的高速“工作台”,彻底避免了抢内存带宽造成的拥堵。

那软银费这么大劲图个啥呢?人家博客里说得很明白,他们就是想实现对计算资源的更底层、更精细的控制。同时,通过这种硬件级别的隔离,能确保不同任务之间“井水不犯河水”,从根本上防止因为资源争抢导致的、不可预测的延迟尖峰。这对于那些对响应时间要求苛刻的在线AI服务来说,简直是救命稻草。

虽然软银这次没公布具体的性能提升了百分之多少这种硬核数字,但他们提到了,这种“分而治之”的策略,在 SLM​ 和 MLM​ 这类工作负载上特别有效。给不太熟悉的朋友解释一下,SLM就是小型语言模型,MLM可能指的是中型语言模型或者多语言模型。总之,就是那些不像千亿参数大模型那么吃光所有资源,但数量多、需要高并发处理的AI任务。这下好了,一块物理卡能同时服务好几个模型,利用率蹭蹭就上去了。

更有意思的是,软银还留了个话口儿,说他们未来计划把这种“ Orchestrator ”的思路,也用到其他AI加速芯片上。不过眼下,这个玩法还只专门为AMD的芯片优化。

所以你看,在NVIDIA几乎一统江湖的AI训练市场,AMD和它的伙伴们(比如软银)正在另辟蹊径。他们不一定是去硬刚最顶峰的算力王座,而是想办法把现有的硬件“绣出更精细的花”,在资源利用率、灵活性和任务并发效率这些细节上做到极致。这招“分而治之”,说不定真能在AI算力这片红海里,给AMD切出一块不一样的蛋糕来。这场大戏,后头还有得看呢!



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
发表于 6 天前 | 显示全部楼层
游客请登录后查看回复内容
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2026-2-23 18:44 , Processed in 0.499201 second(s), 17 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2026 MyDigit.Net

快速回复 返回顶部 返回列表