AMD联手韩国小老弟，要把AI服务器成本打到骨折

麻薯滑芝士 · 发表于昨天 08:34

本帖最后由麻薯滑芝士于 2026-6-22 08:36 编辑

各位搞运维的老哥，还有那些在机房里蹲过、听过服务器风扇轰鸣声听到耳鸣的工程师，以及每个月盯着云服务账单眉头皱成一团的中小企业老板，还有那些一直想试试AI大模型、结果一看显卡报价单就默默关掉网页的个人开发者——今天这条消息你们最好认真看一下。

现在是2026年6月22号，星期一。按理说这是个平平无奇的工作日，大家该摸鱼的摸鱼，该开会的开会。但我翻了翻前几天出来的新闻，发现了一件挺值得拿出来说道说道的事儿。这件事发生在四天前，也就是2026年6月18号。那天，AMD韩国分公司的销售负责人李在亨，跟一家名字听起来有点像热带水果饮料的韩国半导体初创公司MangoBoost的首席执行官金章宇，两个人一块儿出现在了首尔江南区那边的一家酒店里。具体位置是Grand InterContinental Seoul Parnas，中文名叫首尔帕纳斯洲际大酒店。他们在那儿搞了一场联合采访，面对着记者的镜头和录音笔，把接下来要联手干的一件事情给兜了个底朝天。

什么事儿呢？一句话概括就是：他们打算把AI服务器的成本，打到现在的十分之一。对，你没听错，十分之一。不是打个八五折，不是搞个买三送一的促销活动，是直接砍掉九成的开销。

咱们先来聊聊这事儿背后的背景。这几年但凡接触过AI领域的人都知道一个扎心的现实：算力贵，而且贵得离谱。英伟达在GPU市场上基本处于垄断地位，价格由他们说了算。你想训练一个大语言模型，或者把一个AI应用部署上线让它跑起来，光是买硬件的钱就能让你的年度预算表哭出声来。很多中小公司别说搞AI了，连看一眼报价单的勇气都没有——那上面的数字看了晚上容易失眠。

AMD和MangoBoost这次打出的旗号是什么呢？四个字：开放生态。用他们自己的原话说，叫“open heterogeneous computing”——也就是“基于开放生态系统的异构计算”。什么叫异构计算？说白了就是不再死磕一家供应商的芯片，而是把不同厂家生产出来的GPU和CPU混搭在一起用。你家出的GPU配上我家出的CPU，再搭配另一家出的专用处理器，大家伙儿组合成一个团队，一起干活。这么做的目的只有一个：省钱。

李在亨在采访里是这么说的：“一个不依赖于单一供应商的开放生态系统，对于AI的更广泛普及来说是必不可少的，这一点至关重要。”他接着又补了一句：“异构计算——也就是把来自多家供应商的GPU和CPU组合在一起使用——是一条可行的替代路线。”他在采访中把MangoBoost称作是这种部署方案的理想合作伙伴。

那问题就来了：异构计算这事儿说起来轻巧，真要落地做起来难不难？答案是相当难。你把不同厂家生产出来的芯片凑到一起，怎么让它们互相认识、互相配合、高效运转？这里头缺不了两项关键技术：一个是能把不同处理器连接起来的硬件层面的技术，另一个是能优化整个系统性能的软件层面的技术。MangoBoost恰好就是干这个的。

MangoBoost这家公司具体做什么呢？他们主要设计一种叫DPU的芯片，全称是Data Processing Unit，中文叫数据处理单元。这玩意儿的核心作用是加速服务器和服务器之间的网络通信。在传统的服务器架构里头，很多网络通信的任务是由CPU来承担的。你想想看，CPU本来是要干核心计算活的，结果被这些网络通信的杂活儿缠住了手脚。这就好比让一个米其林三星大厨天天蹲在后厨削土豆皮——大材小用不说，还耽误正经事儿。有了DPU之后，这些网络通信的杂活儿就被从CPU身上卸下来了，交给专门的DPU去处理。这样一来，CPU就可以集中精力去干它最擅长的事情，也就是那些核心的计算工作负载。

光有硬件还不够，MangoBoost还开发了一套AI推理软件，名字叫LLM Boost。LLM大家都知道，Large Language Model，大语言模型。这个LLM Boost的作用是在AI模型进行推理的阶段——也就是模型实际投入运行、回答问题、生成内容、做出预测的那个阶段——对模型进行优化，让它在同样的硬件条件下跑得更快、效率更高。目前AMD已经在跟全球范围内的一些客户做概念验证项目了。这种项目在业内通常被称为PoC，全称是Proof of Concept，也就是先搭一个小规模的系统试试水、看看效果怎么样。他们把自家的硬件跟MangoBoost的LLM Boost软件搭配在一起，组装成完整的服务器，交给客户去测试运行。两家公司都说，客户的反馈挺积极的，反响不错。

那这套方案到底能省多少钱呢？李在亨在采访里透露了一个关键数字。他虽然明确表示不能给出具体的定价细节，但他的原话是这么说的：“虽然我们不能披露具体的定价信息，但在保持相同性能水平的前提下，成本可以降低到竞争对手解决方案的十分之一。”十分之一。你原来花一百万才能搞定的算力，现在十万块就能拿下。这要是真能实现，对整个AI行业的冲击力度可想而知。

而且这套方案还有一个好处：现有的GPU资产不需要被淘汰替换，而是可以继续服役。按照他们的模式，客户可以把新一代的GPU和老一代的GPU混在一起使用，老的不用扔，新的直接加进来就行。这对于那些已经在硬件上砸了不少钱的公司来说，无疑是个很有吸引力的选项。

当然，这事儿不是没有门槛的。李在亨自己也承认，从现有的系统切换到异构计算体系，需要一定的技术实力和组织资源。他的原话是：“进入壁垒仍然很高，因为很多组织缺乏必要的人员和所需的能力。”说白了就是：想法很好，方案也很诱人，但你要真动手干起来，得有懂行的人，得有折腾的资本，还得有愿意陪你试错的决心和耐心。

不过MangoBoost这边倒是把这些门槛看作是自己的商机所在。金章宇是这么说的：“我们可以提供那些客户原本需要通过自身投入价值数百亿韩元的投资才能建立起来的专业知识和能力。”注意，他说的可是“tens of billions of won”，也就是数百亿韩元。韩元虽然面值大，但数百亿韩元换算下来也是几千万人民币的量级了。也就是说，MangoBoost把自己定位成一个“技术外挂”——你不用自己砸钱养团队、搞研发、从头摸索试错，你来找我们就行了，我们替你搞定那些复杂的技术活儿。

说到业务规划，MangoBoost最近还搞了一个大动作：他们把自己的商业模式从单纯的芯片设计和软件开发，扩展到了整机系统销售。从今年——也就是2026年——开始，MangoBoost计划直接销售完整的服务器机架系统。这些机架里装了他们自己设计的DPU芯片和他们自己开发的软件解决方案，客户买回去插上电就能直接用，不用自己再去东拼西凑各个部件、调来调去搞兼容性测试。

最后说说MangoBoost今年的目标。金章宇在采访里透露，他们2026年的营收目标是100亿韩元，也就是“10 billion won”。100亿韩元听起来是个不小的数字，但考虑到他们干的事情的体量和整个AI基础设施市场的规模，这个数字其实还算比较克制和务实的。更有意思的是后面那句话：他说明年——也就是2027年——这个数字有望增长十倍。十倍是什么概念？那就是1000亿韩元。一家做DPU芯片和AI推理优化软件的韩国初创公司，如果真能在两年之内把营收从100亿韩元干到1000亿韩元，那说明市场对他们的产品是真金白银地认可了。

AMD跟MangoBoost这对组合能不能真的把AI服务器的价格打下来？开放异构计算这条路能不能走得通？那些习惯了英伟达一家独大的客户愿不愿意尝试混搭方案？这些问题现在都还没有确定的答案，谁也不敢打包票。但至少有一点是明确的：有人在认真想办法让AI变得更便宜、更容易落地。对于那些被高昂算力成本卡住脖子的企业和开发者来说，这总归是个好消息，值得持续关注下去。

新闻来源：The Elec