|
中国AI公司深度求索(DeepSeek) 今天(5月29日)凌晨在上海干了一件大事:他们悄悄更新了自家的 R1 推理模型!这次动作被外界视为向OpenAI等美国对手发起的新一轮挑战。
新版本模型名为 R1-0528,目前已低调上线开发者平台 Hugging Face。有意思的是,深度求索至今未发布官方公告,也没有提供模型说明或性能对比数据。但第三方榜单已经给出了实力验证:
由加州大学伯克利分校、麻省理工学院和康奈尔大学研究人员联合开发的基准测试平台 LiveCodeBench 显示,更新后的 R1 在代码生成能力上表现亮眼:
成绩紧咬 OpenAI 的 o4 mini 和 o3 推理模型,差距微小
领先于 xAI 的 Grok 3 mini 和阿里巴巴的通义千问 Qwen 3
低调的“小升级”
其实在昨天(5月28日),彭博社就率先报道了这次更新。报道提到,深度求索的代表曾在一个微信群里透露,公司完成了这次 “小规模试验性升级”,并邀请用户开始测试。
R1 的“破局”效应
这次更新延续了 R1 模型自今年1月发布以来引发的震动。当时 R1 的横空出世,直接挑战了两个固有认知:
打破了“美国出口管制能阻挡中国AI进步”的论调:R1 以远低于行业的成本,实现了与美国顶尖模型相当甚至更优的性能。
撼动了“做大模型必须砸巨资堆算力”的观念:R1 的成功证明,高效路径同样可行。其发布后,曾导致中国以外地区的科技股应声下跌。
巨头们的连锁反应
R1 的强势表现,也搅动了全球大模型市场的竞争格局:
阿里巴巴(9988.HK) 和 腾讯(0700.HK) 等中国科技巨头随后发布新模型,声称性能超越 DeepSeek R1。
谷歌(GOOGL.O) 为其 Gemini 模型推出了折扣访问层级。
OpenAI 则采取了降价策略,并发布了依赖更低算力的 o3 Mini 模型。
下一步:R2 何时来?
业内普遍预期,深度求索的下一步动作将是发布 R1 的继任者—— R2 模型。路透社在今年3月曾援引消息人士称,R2 原计划在5月发布。值得注意的是,深度求索在3月还升级了其 V3 大语言模型。
这次 R1-0528 的“静默更新”,再次展现了深度求索的技术迭代速度。虽然没有大张旗鼓的宣传,但其在权威代码榜单上紧追 OpenAI 的表现,已经足够引发行业关注。大家都在等:那个传说中的 R2,到底什么时候会来?
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|