数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 126|回复: 0

[科技] 微软Copilot免费福利升级?测试新版AI模型,知识更潮更聪明!​

[复制链接]
发表于 2025-6-24 09:01:20 | 显示全部楼层 |阅读模式
嗨,各位科技爱好者们!微软家的Copilot最近有点风吹草动,咱们得来唠唠。虽然它的人气暂时还没冲到顶流,但讲真,在免费这个档位上,它已经做得挺不错了——能让你体验到部分ChatGPT的主打功能,当然啦,必要的审核和限制它也一样不少。现在最新鲜热乎的消息是啥?微软好像正在进行内部测试,打算给Copilot换个更强的新“大脑”,关键是这事儿免费用户可能也能沾上光!

先给大家快速补补课。Copilot平常跟你聊天,默认有两种模式可选:“快速响应”(Quick Response)用的是OpenAI的普通款模型,主打一个快;另一个叫“深度思考”(Think Deeper),这个模式就厉害了,专门负责那些需要动脑筋、仔细琢磨的复杂任务。如果你觉得这还不够,愿意掏腰包订阅每月20美元(注意金额别错)的Copilot Pro服务,那恭喜你,还能解锁一个更猛的模式:“深度研究”(Deep Research)。

今天咱的重点是这个“深度思考”模式。​​时间回到今年3月(2025年)​​,微软可是亲口盖章确认的:当你点开“深度思考”那个开关,Copilot后台悄悄启用的,就是OpenAI家一个挺能打的模型,江湖人称 ​​o3-mini-high​​。微软当时在更新公告里还说呢:“深度思考的推理模型已升级至OpenAI的o3-mini (high)。这意味着你等答案的时间会更短。” 听着挺美好对吧?但是这个o3-mini-high有个老大难问题:它的知识库 ​​到2023年10月就停更了​​,后面的事儿它基本两眼一抹黑。而且,OpenAI自己都不在ChatGPT Plus、Pro或者企业版里用它了,为啥?人家有了新的心头好。

​​新欢是谁?​​ 就是OpenAI新鲜出炉的 ​​o4-mini-high​​!看微软这架势,明显也不想落后,准备换新装备了!

​​精彩的部分这就来了!​​ 就在最近(2025年6月),包括原文作者在内的一些用户发现,微软Copilot好像玩起了A/B测试(就是让一部分用户偷偷用新版,另一部分还用旧版,比比效果)。

​​实锤测试结果在此:​​

作者用了自己一个微软账号,打开“深度思考”模式,直接拷问Copilot:“你的知识更新到啥时候了?” Copilot回答得那叫一个斩钉截铁:“​​2023年10月​​。” 这答案,妥妥地暴露了它还在用 ​​o3-mini-high​​ 老模型干活儿呢。
作者灵机一动,换了个微软账号,同样打开“深度思考”,又问了一遍知识更新时间。这次,Copilot的回答变了:“我的训练数据包含了截至 ​​2024年6月​​ 的信息。” 嘿!这差别可不是一星半点!
​​这第二个回答为啥这么关键?​​ 结合各路测试和线索来看,Copilot这次极有可能就动用了那个新家伙 ​​o4-mini-high​​。为啥倾向于认为是带“high”后缀的o4-mini-high,而不是普通的o4-mini呢?因为微软有前科啊!之前给Copilot整合那个o3-mini的时候,选的也是带“-high”后缀的这个推理加强版,这次大概率还是这套路。OpenAI官方早就说明了,无论是o4-mini还是o4-mini-high,它们的知识更新​​通通都是截至2024年6月1日​​。​​同样,o3模型的知识更新也是到2024年6月1日结束,o3-mini-high则停在2023年10月1日,OpenAI最新的GPT-4.1系列(包括mini和nano)知识范围也是到2024年6月。​​

​​肯定有小伙伴灵光一闪:等等!也可能是用了知识同样更新到2024年6月的 o3 模型啊?​​

这个想法嘛...​​老实说可能性低得可怜​​。o3模型可是OpenAI家高端大气的主力选手,价格标签后面跟着一串零——贵啊!微软给“深度思考”设定了一个30秒左右的时间限制不是没道理的,就是为了控制成本。你品,放着原先那个高性能但成本相对能接受的o3-mini-high不用,突然换成更金贵的o3?这买卖怎么算都觉得亏本!当然咯,技术圈的事儿嘛,也不能完全排除个万一,但拍着胸脯说,​​最有戏的还是那个既新又强性价比还高的 o4-mini-high​​。

​​那么,这o4-mini-high到底牛在哪?​​ OpenAI可是放话了:新一代的o4-mini,那性能是全方位 ​​碾压​​ 前作o3-mini的,​​最气人的是——它还更便宜了!​​

​​真刀真枪比比看:​​ 考考它国际数学竞赛的 ​​AIME真题​​,

老将 ​​o3-mini​​ 做 ​​2024年的卷子​​,得分率大概 ​​87%​​;遇上 ​​2025年的卷子​​,差不多 ​​86.5%​​。
新秀 ​​o4-mini​​ 做 ​​2024年的卷子​​,得分率飙升到 ​​93.4%​​;面对 ​​2025年的卷子​​,也有 ​​92.7%​​ 的水平。
这进步,是不是相当明显?

再看看它们带“-high”后缀、专门负责深度推理的版本:​​对比老款的o3-mini-high,新款的o4-mini-high工作时更爱“动脑子”​​。意思是它会在内部推理上花更多时间,有点像更仔细地打草稿,这样出来的最终答案,质量肯定也是蹭蹭往上涨。

​​所以这事儿简单说:​​ 微软如果真能把测试完成,把​​知识更新到去年(2024年)6月、推理能力更强、成本反而更划算的 o4-mini-high​​,最终推广给所有Copilot用户(至少是用了“深度思考”的免费用户),那这个AI免费套餐的“香”度,怕是要直接原地起飞了!咱们啊,就准备好瓜子板凳,等着微软官方的后续消息吧!







本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-7-22 20:44 , Processed in 0.078000 second(s), 7 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表