数码之家

 找回密码
 立即注册
搜索
查看: 104|回复: 0

[科技] 谷歌Gemini 2.5 Pro屠榜AI测试:200万token上下文即将解锁

[复制链接]
发表于 2025-3-26 10:15:26 | 显示全部楼层 |阅读模式
最近科技圈有个大新闻:谷歌正式推出全新旗舰AI模型Gemini 2.5 Pro。要知道现在流行的ChatGPT、Grok这些AI,底层架构用的都是谷歌七年前发明的Transformer技术。这次迭代的2.5版本主打"思考型AI",模型会在生成答案前像人类那样分步骤推理论证,通过强化学习和思维链提示技术反复修正结论。

在LMArea平台(一个让用户给AI答案打分的公开评测网站)最新榜单里,Gemini 2.5 Pro拿下了综合排名第一,特别是在编程、数学、创意写作、复杂指令处理等高难度项目表现突出。它不仅超越了xAI的Grok 3,还把OpenAI的GPT-4.5甩在身后。在AIME、LiveCodeBench、SWE-Bench等20多个行业标准测试中,该模型同样保持领先,其中在号称"AI终极挑战"的HumanEval测试中获得了18.8%的当前最高分。

更厉害的是这个模型的"记忆力"——现在能处理100万token的上下文信息,官方确认即将升级到200万token。这个容量足以让AI读完《哈利波特》全集后还能记住细节。目前所有订阅Gemini Advanced服务的用户,在网页端和手机端选择模型时都能看到2.5 Pro选项。

虽然谷歌没有公布具体技术细节,但从业内流出的信息看,这次升级重点优化了多轮对话和长文本处理能力。有开发者试用后表示:"处理技术资料时终于不用反复粘贴文本了"。不过要注意,模型在中文场景下的表现还有待观察。

注:1 token≈0.75个英文单词,实际处理效率受文本复杂度影响





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-11 00:38 , Processed in 0.265201 second(s), 10 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表