数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 67|回复: 0

[业界] 深度求索V4预览版上线!开源省钱跑国产芯,AI圈又得洗牌?

[复制链接]
发表于 2026-4-24 19:05:54 | 显示全部楼层 |阅读模式
本帖最后由 麻薯滑芝士 于 2026-4-24 19:28 编辑

哎,我说那些天天在开源社区里扒拉新模型、琢磨怎么集成进自己项目里的程序员老铁们,注意了啊!还有那些开盘就盯着港股科技板块、手指头放在交易键上随时准备点下去的投资者大佬,也看过来!当然啦,就算你只是个爱看科技公司“神仙打架”、热衷吃一手新鲜瓜的围观群众,今天这热闹你也绝对不容错过——因为咱们中国AI圈那个最能整活儿、最不按常理出牌的“显眼包”,它,又上新了!

就今天,2026年4月24号,礼拜五,根据外媒CNBC的报道,来自杭州的深度求索(DeepSeek)公司,把他们家让不少人惦记了好一阵子的V4大语言模型,以“预览版”的形式,给丢出来了!

你可能要问,啥叫“预览版”?哎,这就跟你们玩游戏时候遇到的“Beta测试服”差不多一个意思。就是这模型的核心功能啊、主要本事啊,基本上都做得七七八八了,但还没到最终完美亮相、正式对所有人开放的那一步。先放出来,就像是邀请大家进一个“内部体验场”,不管是开发者还是感兴趣的用户,都能提前上手摸一摸,试试它到底新增了哪些能耐,有没有什么让人眼前一亮的新花样,顺便也帮着找找看还有没有藏着的“小虫子”。所以,这可不是一次普通的版本更新,这是一次公开发出的“试用邀请函”。

但如果你觉得这只是一次常规的“邀请试用”,那格局可就有点小了。想弄明白为啥这个V4的发布能撩动这么多人的神经,咱们还真不能就事论事,得把这家公司的“发家史”稍微往回倒那么一点带,看看它到底是怎么在高手林立的AI圈里,闯出自己名号的。

深度求索这家公司,成立时间是2023年。但它真正第一次在国内外科技圈里砸出水花、让很多人记住这个名字,是前年,也就是2024年年底。那时候它推出了一个叫V3的模型。这个V3当时有两点特别唬人:第一,它完全免费;第二,它的代码完全开源,敞开了给你看给你用。但这还不是最绝的,最绝的是他们自己轻描淡写地透露,训练这个V3,用的计算芯片比OpenAI、谷歌他们当时用的主力芯片要“弱”一个档次,而总共花的钱,更是只有那些行业巨头的“一个零头”。这操作当时就让很多圈内人直挠头:用更次的“厨具”和更少的“食材”,还真能整出一桌不赖的“酒席”?

然而,所有人都没想到,这桌“酒席”只是个前菜。就在V3发布后仅仅几个礼拜,到了去年,也就是2025年1月,深度求索反手又丢出了一个叫 R1​ 的“推理模型”。这个R1一被送到各种国际通用的标准测试里跑分,好家伙,成绩直接追平,甚至在不少关键项目上反超了许多全球顶尖的大语言模型。这已经够让人惊掉下巴了吧?但真正让全球科技投资圈集体“瞳孔地震”的剧本这才上演:深度求索自己用一种近乎“凡尔赛”的语气说,做出这个性能吓人的R1,他们总共只花了两个月时间,成本还不到600万美元,用的甚至都不是英伟达最顶级、最昂贵的那一批芯片。

这个消息就像一块巨石砸进了平静的湖面。一时间,各种议论和质疑都来了:美国在AI领域的传统领先地位,是不是没想象中那么牢固了?硅谷那些科技巨头们,每年砸几百上千亿美元去建超算中心、抢购天价芯片,这种“大力出奇迹”的烧钱模式,效率是不是太低了点?这个来自中国的R1,用它极致的“性价比”,让整个行业都不得不重新审视技术发展的路径和成本。

不过,自打那个震撼全场的R1之后,深度求索虽然也陆陆续续发布过一些模型的升级和迭代,但说实话,再没有哪个能像R1那样,引发全球范围的讨论和资本市场的剧烈波动了。

所以,今天这个V4预览版一冒头,所有人脑子里蹦出的第一个问题肯定是:兄弟,你还能不能像去年R1那样,再搞一次全球级别的“震撼教育”?
关于这个大家都关心的问题,CNBC的记者去问了华尔街那帮专门琢磨这些事的分析师。晨星公司那位资深的股票分析师,伊万·苏(Ivan Su),他的看法挺有意思。他觉得,这次V4想像R1那样,在股票市场掀起同样规模的惊涛骇浪,可能性不是很大。理由很简单,现在的股票交易员们,脑子里已经被反复“教育”过了,他们已经普遍接受了“中国的AI模型确实有竞争力,而且用起来性价比就是高”这个基本设定。这个预期,早就反映在过去一年的股价波动里了,算是被市场消化得差不多了。

但是,他接下来话锋一转,点出了一个比“能否震惊世界”更微妙、也更关键的变化。他说,深度求索这次给V4的公开定位,非常明确地把其他中国的开源模型,直接摆在了擂台对面,当成了需要正面竞争的对手。这种“摆开擂台,明确告诉国内的其他兄弟们‘咱们来比划比划’”的清晰架势,在去年发布R1的时候,是完全没有的。他原话说的是:“这种定位框架在R1时期是不存在的,单单这一点就能告诉你,国内(AI模型)的竞争已经激烈到什么程度了。”

他这话可不是随便说说的。自从R1一炮而红、成为行业“性价比”标杆之后,深度求索在中国这片已经卷成“红海”的AI战场上,面临的压力不但没减小,反而更大了。光就今年,阿里巴巴、字节跳动这些要钱有钱、要人有人的互联网巨头,也都纷纷亮出了自家打磨的新模型。大家的目标都很一致:抢夺开发者的注意力,争夺有限的企业客户和市场预算。

市场的反应永远是最诚实、也最迅速的体温计。就在今天,V4发布的消息一传出来,港股市场上,其他几家中国AI公司的股价,立马就给出了“绿色”回应。专注于AI应用的MiniMax和智谱AI,股价大概都跌了8%左右;另一家总部同样在杭州的AI开发商“群核科技”,股价跌得更狠,一下子掉了9%。你看,资本用脚投票的信号再清晰不过了:它们觉得深度求索这把“新火”,很可能会挤压其他同行们的市场空间和想象空间。

好了,背景铺垫、前因后果咱们唠了这么多,现在该把聚光灯打回今天真正的主角——DeepSeek V4预览版自己身上了。咱们来仔细瞅瞅,它到底带了哪些“真家伙”上阵。

第一,“开源”这面大旗,扛得稳稳的。​ 跟他们家以前发布所有模型的传统一样,这次的V4预览版,代码依然是开源、开放的。这意味着全世界的开发者,只要你感兴趣、有需要,就能直接把它的模型文件“拖”到你自己的电脑或者服务器上,本地运行、随便折腾。而且在绝大多数情况下,你还可以根据自己项目的特殊要求,对代码进行修改和定制。这对全球开发者社区来说,是一种难以抗拒的吸引力,因为自由度和可控性太高了。

第二,这次玩了个“双版本”策略,一个叫“Pro”(专业版),一个叫“Flash”(快速版)。​ 这俩的主要区别,就在于模型本身的体积和复杂程度不一样。打个不太精确的比方,“Pro”版可能像个功能齐全的“瑞士军刀”,各方面能力更强大、更全面;而“Flash”版则像一把更轻便的“折叠刀”,追求的是速度和响应效率,让你在资源有限的情况下也能快速用上。深度求索自己宣称,这个V4在面对国内同行竞争对手时,表现相当“扛打”,特别是在“智能体任务”、知识处理和逻辑推理这些方面。

哎,说到这里咱得稍微停一下,给不太接触技术概念的朋友们简单“翻译”一下,啥是“智能体任务”?你可以把它想象成,你不是在向AI提一个简单的问题,而是在给它下达一个复杂的、多步骤的“工作任务”。比如说,你命令它:“去帮我全网搜罗一下最近三个月所有关于‘室温超导’材料进展的权威论文和新闻报道,然后剔除掉那些不靠谱的传言,整理出一份带有核心结论和争议点的详细摘要,最后再用这个摘要,生成五个可能的应用方向设想。” 你看,在这个过程中,这个AI可能需要自主调用网络搜索工具、理解并筛选海量专业信息、进行逻辑归纳、最后还要进行创造性发散。它不再是一个简单的问答机器,而像一个能自己调度多种工具、有初步规划能力的智能助手。深度求索说,V4在这方面特别强。

第三,一个最实在、也最戳中开发者心窝子的优点:听说运行成本更低了。​ 市场研究机构Counterpoint Research的副总裁尼尔·沙阿(Neil Shah),跟CNBC记者说得非常直白,他说“DeepSeek的V4预览版,这纯粹是在秀实力、晒肌肉”,因为它运行起来的“推理成本”比之前的模型还要低。

这里插播一个必懂的小知识:“推理成本”到底是个啥?简单说,就是一个已经训练好的AI模型,每次实际为你干活——比如回答你的问题、帮你写总结、生成图片——的时候,背后需要动用的计算资源(主要是芯片算力和电力)所折算成的真金白银。这个成本越低,意味着将来任何公司或者个人想大规模使用它、把它集成到自己产品里的花费就越少,商业化的门槛也就越低。Counterpoint的另一位首席AI分析师孙炜(Wei Sun)也认为,从V4目前公布的一些基准测试数据来看,它很有可能提供“非常出色的智能体能力,同时成本还大幅降低”。说白了,就是“又要马儿跑,又要马儿吃得少”。

第四,专门为市面上流行的AI智能体工具做了深度“优化适配”。​ 深度求索明确说了,V4已经经过了专门的调校,能够更好地和Anthropic公司的Claude Code,以及OpenClaw这些目前比较热门的智能体框架和工具“搭档”干活。这个意图很明显,它不想只做一个孤零零的、需要开发者费很大劲才能接进去的模型,而是想主动“拥抱”现有的、流行的生产力生态,让程序员们能更顺畅、更省心地把V4融入到实际的工作流里去,直接提升效率。

好了,关于V4模型本身的能力和特点,咱们先唠到这儿。接下来,咱们必须直面那个最硬核、也是最敏感、谁都绕不开的问题了,这也是今天所有科技新闻报道都在猜测和分析的焦点:训练这个V4,用的到底是哪家的芯片?

这个问题之所以如此关键,甚至超越了单纯的技术讨论,是因为它背后牵扯的,是当下全球科技领域最核心的博弈之一。CNBC的报道里也花了相当大的篇幅来探讨这一点。中国的科技巨头华为,就在今天,周五,公开确认了一件事:他们家最新的、基于自家昇腾(Ascend)AI处理器打造的AI计算集群,可以支持、能够顺利运行深度求索的这个V4模型。

但是,报道也立刻补充了一个重要的“未解之谜”:到目前为止,外界仍然不清楚,在训练V4的整个漫长而耗资巨大的过程中,华为的芯片到底被使用了多少,它与美国AI芯片的绝对领导者——英伟达(Nvidia)的芯片相比,在训练任务中的占比各自是多少。这个背景大家多少都有所了解,由于华盛顿方面不断变化、持续收紧的出口管制政策,中国的公司和研究机构想直接、稳定地获取英伟达最先进、最顶级的那一批AI芯片,已经变得异常困难。与此同时,北京方面也在持续加大力度推动国内半导体产业链的发展,并且有诸多报道显示,正在鼓励乃至引导国内的科技公司和云服务商,更多地采购和使用华为、海光等国产芯片厂商的替代方案。

刚才提到的那位分析师孙炜,就把这件事可能带来的深远影响点得更透了。她说,如果V4能够“原生地”、也就是不需要经过复杂的移植和适配就能高效地在中国本土的芯片上运行,那么这里面的战略意义将非常重大。这将有助于中国在AI领域获得更高的“技术自主性”,进一步减少在核心算力上对英伟达的依赖。她甚至还补充了一个更宏观的视角:“这最终也会加快全球AI发展的整体速度。”

资本市场的嗅觉永远是最灵敏的。就在深度求索宣布V4发布之后,港股市场上,那些中国的芯片制造与代工企业的股价,应声而起。中芯国际(SMIC)的股价上涨了9%,华虹半导体(Hua Hong Semiconductor)的涨幅更加惊人,达到了15%。这无疑是一个强烈的市场信号:投资者认为,深度求索V4对国产芯片的适配和优化,给国产AI芯片产业链的故事,注入了新的、强劲的想象空间。

所以,你看,就这么一个AI模型的“预览版”发布,像一块石头投入水中,激起的涟漪却层层扩散,触及了从技术路线、公司竞争、市场情绪,到国际产业政策、供应链安全乃至地缘科技博弈的方方面面。深度求索的这个V4,看起来绝不仅仅是一次简单的版本号迭代,它更像是在当前这个异常复杂和充满不确定性的内外环境下,一步经过深思熟虑的落子。它左手继续高高举起“开源”和“极致性价比”这两面最能吸引全球开发者和价格敏感型市场的旗帜,右手则在“国产芯片生态兼容”和“复杂智能体任务能力”这两个至关重要的战略高地上,默默地构筑着护城河。

那么,回到最开始那个问题:它最终是能复制R1那样的传奇,成为又一个让全球侧目的现象级产品,还是在中国AI产业已经激烈万分的内部竞争中,一把帮助公司杀出重围、确立优势的利器?现在下结论还为时过早,咱们得让这颗“子弹”再飞一会儿,看看它实际在开发者手中、在各种复杂场景下的真实表现究竟如何。

但有一点或许是可以期待的:在AI这个赛道里,能有这么一家公司,持续不断地尝试在保证甚至提升模型能力的前提下,想尽办法把训练和使用的成本“打下来”,把技术的门槛“踩下去”,对于咱们所有普通的开发者、创业者乃至最终用户来说,总归不是一件坏事。它意味着,我们离用上更聪明、更便宜、也更顺手的AI工具的那一天,或许真的在一步步靠近。

行了,各位在代码海洋里“游泳”的程序员、在投资曲线里“冲浪”的观察家、以及所有关心科技如何改变咱们生活的朋友们,今天这个关于DeepSeek V4预览版的长篇大论,咱就先唠到这儿。要是您觉得哪儿还没说透,或者对AI领域的其他瓜也感兴趣,咱随时可以接着再聊!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|数码之家-技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2026-5-14 02:13 , Processed in 0.140400 second(s), 9 queries , Gzip On, Redis On.

Powered by Discuz!

© MyDigit.Net Since 2006

快速回复 返回顶部 返回列表