数码之家

 找回密码
 立即注册
搜索
查看: 675|回复: 0

[业界] 伯克利团队30美元复现DeepSeek核心技术 低成本AI训练突破引关注

[复制链接]
发表于 2025-1-30 00:09:37 | 显示全部楼层 |阅读模式
TOP 2 1月30日消息:加州大学伯克利分校AI研究团队昨日宣布,在博士生潘佳怡带领下仅用30美元成功复现深度求索(DeepSeek)R1-Zero核心算法,并通过英国益智节目《倒计时》游戏验证,展现低成本实现高级语言模型的新路径。

研究团队以3亿参数小模型为基底,基于强化学习框架开发出自主验证与搜索能力。实验显示,模型最初仅会随机输出答案,但在《倒计时》游戏的算数挑战中逐渐演化出"验证-修正"策略:首先生成初步答案,通过多轮迭代修正直至找到正确解。在乘法运算测试中,模型甚至自发运用分配律拆解大数运算,展示出类人解题思维。

团队尝试不同参数规模后发现,5亿参数模型仅能输出单一答案,而1.5亿参数以上版本开始显现策略优化能力。当参数提升至3-7亿时,模型解题步骤显著精简。值得注意的是,整个训练过程仅消耗约30美元计算资源,相较OpenAI的o1接口成本降低27倍。

该成果引发业界对AI研发成本的热议。虽然机器学习专家Nathan Lambert质疑深度求索公布的500万美元训练成本未包含人力、基建等隐性支出,估算其年运营成本或达5-10亿美元,但伯克利团队的实践仍具里程碑意义——相较于美国同行年均百亿美元的AI投入,该研究为中小团队参与前沿探索提供了可行性范本。





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-11 03:35 , Processed in 0.234001 second(s), 9 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表