|
中国AI独角兽深度求索(DeepSeek)于2025年4月30日低调上线专业数学推理模型Prover-V2,恰逢阿里云发布Qwen3次日。这是该团队继去年12月震撼业界的V3模型后,在开源社区的又一次突击。
这个6720亿参数的"解题专家"悄悄登陆全球最大开源平台Hugging Face,官方渠道全程零宣发。技术文档显示其基于V3混合专家架构开发,继承了低成本训练策略。业内人士指出,这类专项模型能显著增强通用大模型的数学论证能力,或为即将发布的DeepSeek-R2推理大模型埋下伏笔。
这已是Prover系列的第三次迭代。去年8月发布的V1.5版本首次实现形式化定理验证,四个月后其底层技术孵化出震惊行业的V3主模型。据技术白皮书披露,该系列通过领域预训练突破数学符号推理瓶颈,曾在国际数学奥林匹克竞赛题库中达到83%的解题准确率。
有趣的是,阿里云刚宣称Qwen3在GSM8K等基准测试中超越深度求索R1和OpenAI o1模型,次日便迎来竞争对手的技术反制。公司官网公告显示,此前已对V3基础模型进行优化升级,重点强化中文写作与代码生成能力。截至发稿前,深度求索尚未对此轮开源动作作出官方回应。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|