数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 56|回复: 0

[科技] 谷歌Gemini真夺国际奥数金牌,35分战绩看呆评委​

[复制链接]
发表于 昨天 11:11 | 显示全部楼层 |阅读模式
哎呦喂,AI做题这事儿,这回可整了个大新闻!就在近期,谷歌家的AI扛把子——那个开了“深度思考”(Deep Thinking)外挂的Gemini模型——实实在在地在国际数学奥林匹克竞赛(IMO)这块人类顶级智力竞技场上,​​捞到了一块货真价实的金牌​​!要知道,IMO的题目哪一题不是要烧干脑细胞?什么奇思妙想、独特解法,那都是标配,妥妥的地球上最让人头疼的数学难题集合地。

成绩刚一出来,谷歌家的DeepMind团队就迅速发布官方声明​​给认领了。连国际数学奥林匹克竞赛的大当家,主席格雷戈尔·多利纳尔教授(Prof. Dr. Gregor Dolinar)都亲自盖章:“咱这儿能证实,谷歌DeepMind确实闯过了大家伙儿心心念念那道坎儿,​​整了个42分满分的卷子,愣是拿下35分​​——这可是金牌得主的水准!他们交的答卷,好些地方真让人开眼。IMO批卷的老师傅们都觉得,人家写的解题步骤​​清清楚楚、倍儿精准,而且瞅着还不费劲​​。”

听上去好像就一句“电脑算题快呗”,可这回压根儿不是那么回事儿。Gemini这次亮的大招,玩的是​​端到端自然语言处理​​的套路。什么意思?人家AI是​​直接把题目描述那一堆文字吃进去,然后自己吐出来一串完整的数学证明​​!神奇就神奇在,这些证明写出来吧,人家IMO阅卷组的老学究们一瞧,嘿,​​思路清爽得直晃眼,证明过程挑不出刺儿​​。

至于为啥这次Gemini这么能打?秘密武器就是那个刚刚升级的​​Gemini Deep Think功能模块​​。这玩意儿相当于给模型套了个升级版“推理引擎”,专门收拾那些烧脑的硬骨头题。谷歌这次可是把压箱底的新研究都给塞进去了,其中就有个叫​​并行思考(parallel thinking)​​ 的独门技巧。有了它,Gemini做题就不再是单线程死磕了,而是能​​同时噼里啪啦冒出好几条解题思路,互相参考着捋顺溜了,最后才拍板用哪个答案​​。这说明啥?说明AI的推理能力正​​一步一个脚印地往“独立自主处理复杂信息”这条道上奔呢​​,而且人家走的还是​​分层规划、多步骤稳扎稳打的路子​​。

更显实力的是,谷歌Gemini这套操作,全程是在​​IMO规定的4.5小时限时内完完整整搞定​​的,一点儿没超时,这才算数,拿到了正式的竞赛成绩。不过嘛,光想想也知道这4.5小时烧的“脑细胞”——呃,是服务器——​​成本指定便宜不了​​。那可是在谷歌顶级TPU上跑着的、参数规模论万亿计的顶尖大模型,测试模式全开,拉满算力跑上4.5个钟头,电表都得哗哗转吧?(​​具体花多少银子,谷歌还没吱声​​。)

最后划重点!谷歌说了,这个立功的​​Deep Think功能,很快就要对Gemini Ultra付费会员开放​​!不过嘛,想解锁这项“做题神器”,加上更高的使用权限,价格牌上写着呢:​​每月249.99美元​​。怎么样,这“脑力外挂”的代价,您觉得值不值?



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-7-23 08:44 , Processed in 0.140400 second(s), 13 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表