数码之家

 找回密码
 立即注册
搜索
查看: 83|回复: 1

[产品] 深度求索低调开源数学大模型Prover-V2:推理升级 迎战阿里Qwen3

[复制链接]
发表于 昨天 20:33 | 显示全部楼层 |阅读模式
中国AI独角兽深度求索(DeepSeek)于2025年4月30日低调上线专业数学推理模型Prover-V2,恰逢阿里云发布Qwen3次日。这是该团队继去年12月震撼业界的V3模型后,在开源社区的又一次突击。

这个6720亿参数的"解题专家"悄悄登陆全球最大开源平台Hugging Face,官方渠道全程零宣发。技术文档显示其基于V3混合专家架构开发,继承了低成本训练策略。业内人士指出,这类专项模型能显著增强通用大模型的数学论证能力,或为即将发布的DeepSeek-R2推理大模型埋下伏笔。

这已是Prover系列的第三次迭代。去年8月发布的V1.5版本首次实现形式化定理验证,四个月后其底层技术孵化出震惊行业的V3主模型。据技术白皮书披露,该系列通过领域预训练突破数学符号推理瓶颈,曾在国际数学奥林匹克竞赛题库中达到83%的解题准确率。

有趣的是,阿里云刚宣称Qwen3在GSM8K等基准测试中超越深度求索R1和OpenAI o1模型,次日便迎来竞争对手的技术反制。公司官网公告显示,此前已对V3基础模型进行优化升级,重点强化中文写作与代码生成能力。截至发稿前,深度求索尚未对此轮开源动作作出官方回应。





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
发表于 昨天 20:54 | 显示全部楼层
继续卷起来,希望越来越好用
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-2 03:27 , Processed in 0.109201 second(s), 6 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表