|
|
哎,各位关注AI动态、芯片行情还有国际科技新闻的网友们,赶紧坐过来,今儿早上刷到的这条消息,信息量可太大了,而且味儿特别冲,必须立刻马上跟各位好好唠唠!
路透社在4月5号,也就是上周日,发了一篇报道,源头是美国一家叫The Information的数字新闻媒体。他们说,得到独家消息,中国那个最近火出圈的AI公司深度求索(DeepSeek),他们家即将发布的新一代大模型,叫 DeepSeek-V4,确定一定以及肯定,要跑在华为技术公司设计的最新芯片上!
对,你没听错,不是英伟达的H100、B200,是华为的芯片。报道里引用了五个“直接了解采购情况”的人士的话,说得有鼻子有眼:为了给V4的发布做准备,中国的科技巨头们,包括阿里巴巴、字节跳动和腾讯控股,已经向华为下了大批量的订单,买他们即将推出的新芯片,总订单量高达数十万颗!这可不是小打小闹,这是真金白银、摆开阵势要干了。
报道还说,这个下一代模型,很可能在“未来几周内”就会正式推出。华为和DeepSeek那边,在非工作时间暂时没回复路透社的置评请求,但这个消息本身的劲爆程度,已经足够让整个圈子睡不着觉了。
这事儿为啥这么炸?咱得掰开揉碎了说。第一,这等于官宣了DeepSeek的“技术站队”。报道里提到,在过去的几个月里,DeepSeek的工程师一直在直接和华为,还有另一家中国芯片设计公司寒武纪(Cambricon)紧密合作,帮着重写模型底层代码的一部分,并且一直在做测试。这意思很明白,DeepSeek V4从设计之初,就是瞄着国产芯片的架构去优化的,不是简单地把为英伟达芯片写的代码搬过来跑跑看。
更绝的是,报道还透露,DeepSeek其实还在捣鼓另外两个V4的变体版本,每一个都针对不同的能力做了优化,但共同点是——都是为跑在中国芯片上而生的。这说明啥?说明这不是一次性的适配,这是一整套基于国产硬件生态的技术路线图。
其实这个苗头今年初就有迹可循。路透社自己之前就报道过,DeepSeek这次更新旗舰模型,破天荒地没有先拿给美国的芯片制造商(比如英伟达、AMD)看,让他们帮着做性能优化,这完全违背了行业惯例。通常一个大模型要发布前,都得跟芯片厂深度合作,把代码调到最适配,才能发挥出硬件百分百的实力。但DeepSeek这次,直接把早期访问权限给了一水儿的国内供应商,华为是头一个。
你可能会问,DeepSeek一个搞AI算法的,为啥要这么“刚”,去碰适配不同芯片架构这种硬骨头?这里头背景可就深了。还记得去年(2025年)DeepSeek发布低成本模型V3和R1的时候,引发了什么吗?直接触发了一轮全球科技股的抛售潮!因为投资者突然发现,哦,原来不用花天价去买最顶级的美国AI算力,用相对低成本的方法也能搞出效果惊人的模型,那美国那些AI公司烧的几十亿、几百亿美元,是不是有点冤大头?自打那以后,整个业界对还没露面的DeepSeek-V4,那是又好奇又紧张,就等着看它还能玩出什么花来。
所以,现在这个“V4跑在华为芯片上”的消息一出来,等于是把这种紧张感推到了一个新高点。它传递的信号远远超出一个公司和一个产品的合作,而是标志着中美在AI这个最关键赛道上的“脱钩”,已经从软件生态、模型竞争,深入到了最底层、最硬的算力基础。
对于华为来说,这无疑是其昇腾(Ascend)AI芯片生态的一次里程碑式胜利。能获得国内最顶尖AI模型公司的深度支持和批量采购,是对其芯片性能和软件栈成熟度的最强背书。对于阿里巴巴、字节跳动、腾讯这些云巨头来说,大批量采购华为芯片,既是为了支持V4,恐怕也是在为自身未来庞大的AI算力需求,寻找一条不依赖海外供应链的“安全通道”。
当然,挑战也明摆着。华为最新的AI芯片,其绝对性能、尤其是软件生态的丰富程度,与耕耘了十多年的英伟达CUDA帝国相比,仍有差距。DeepSeek的工程师需要“重写部分底层代码”,就说明了适配的复杂性和工作量。但反过来看,一旦V4在华为芯片上真的跑出了惊艳的效果,那将是对整个中国AI硬件产业一剂无比强劲的“强心针”。
总而言之,DeepSeek V4这次还没露面,就已经在棋盘上落下了一颗分量极重的棋子。它不再仅仅是一个模型性能的竞赛,更成了一场关于技术路线自主、算力主权乃至地缘政治的“前哨战”。接下来几周,当V4真的发布,它的性能表现、尤其是在华为芯片上的实际效率,将会是检验这套“中国方案”成色的第一块试金石。全球的AI从业者、投资者,还有政策制定者,恐怕都得屏住呼吸,好好看一看了。这场大戏,才刚刚拉开帷幕。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|