|
哎呦喂,AI做题这事儿,这回可整了个大新闻!就在近期,谷歌家的AI扛把子——那个开了“深度思考”(Deep Thinking)外挂的Gemini模型——实实在在地在国际数学奥林匹克竞赛(IMO)这块人类顶级智力竞技场上,捞到了一块货真价实的金牌!要知道,IMO的题目哪一题不是要烧干脑细胞?什么奇思妙想、独特解法,那都是标配,妥妥的地球上最让人头疼的数学难题集合地。
成绩刚一出来,谷歌家的DeepMind团队就迅速发布官方声明给认领了。连国际数学奥林匹克竞赛的大当家,主席格雷戈尔·多利纳尔教授(Prof. Dr. Gregor Dolinar)都亲自盖章:“咱这儿能证实,谷歌DeepMind确实闯过了大家伙儿心心念念那道坎儿,整了个42分满分的卷子,愣是拿下35分——这可是金牌得主的水准!他们交的答卷,好些地方真让人开眼。IMO批卷的老师傅们都觉得,人家写的解题步骤清清楚楚、倍儿精准,而且瞅着还不费劲。”
听上去好像就一句“电脑算题快呗”,可这回压根儿不是那么回事儿。Gemini这次亮的大招,玩的是端到端自然语言处理的套路。什么意思?人家AI是直接把题目描述那一堆文字吃进去,然后自己吐出来一串完整的数学证明!神奇就神奇在,这些证明写出来吧,人家IMO阅卷组的老学究们一瞧,嘿,思路清爽得直晃眼,证明过程挑不出刺儿。
至于为啥这次Gemini这么能打?秘密武器就是那个刚刚升级的Gemini Deep Think功能模块。这玩意儿相当于给模型套了个升级版“推理引擎”,专门收拾那些烧脑的硬骨头题。谷歌这次可是把压箱底的新研究都给塞进去了,其中就有个叫并行思考(parallel thinking) 的独门技巧。有了它,Gemini做题就不再是单线程死磕了,而是能同时噼里啪啦冒出好几条解题思路,互相参考着捋顺溜了,最后才拍板用哪个答案。这说明啥?说明AI的推理能力正一步一个脚印地往“独立自主处理复杂信息”这条道上奔呢,而且人家走的还是分层规划、多步骤稳扎稳打的路子。
更显实力的是,谷歌Gemini这套操作,全程是在IMO规定的4.5小时限时内完完整整搞定的,一点儿没超时,这才算数,拿到了正式的竞赛成绩。不过嘛,光想想也知道这4.5小时烧的“脑细胞”——呃,是服务器——成本指定便宜不了。那可是在谷歌顶级TPU上跑着的、参数规模论万亿计的顶尖大模型,测试模式全开,拉满算力跑上4.5个钟头,电表都得哗哗转吧?(具体花多少银子,谷歌还没吱声。)
最后划重点!谷歌说了,这个立功的Deep Think功能,很快就要对Gemini Ultra付费会员开放!不过嘛,想解锁这项“做题神器”,加上更高的使用权限,价格牌上写着呢:每月249.99美元。怎么样,这“脑力外挂”的代价,您觉得值不值?
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|