数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 49|回复: 1

[科技] 微软放出Phi-4 15B:会自己决定什么时候“动脑子”的AI

[复制链接]
发表于 5 天前 | 显示全部楼层 |阅读模式
各位捣鼓AI模型、跑开源项目的老铁们,还有那些对“AI到底咋思考的”这事儿特别好奇的技术宅们,放下你们手里正在微调的代码,来瞅瞅微软刚刚整出来的新花样。就在昨天,3月4号,微软不声不响地丢出来一个名叫Phi-4 15B的新模型,这消息是海外科技媒体Neowin报的。光听名字你可能觉得,哦,又是一个开源模型呗。但这次,微软在这个小家伙身上塞了个挺贼的功能,让它干了一件很多比它大得多的模型都不太会干的事儿——它居然能自己决定,什么时候该“认真想想”,什么时候可以直接“秒回”。

这玩意儿全名叫“Phi-4-reasoning-vision-15B”,是个150亿参数的“多模态”模型。简单说就是,它既能看懂图片给你描述内容,能在软件界面上精准定位一个按钮,还能处理挺复杂的数学题。参数规模15B,在动辄几百B、上千B的模型世界里不算巨无霸,但微软这次玩的是“巧劲儿”。

它最核心的那个卖点,我得多唠两句。平常咱们用大多数AI模型,尤其是开源的这些,你得手动给它下命令:要么你让它开启“思考模式”(Chain-of-Thought),让它一步一步推导给你看;要么你就让它直接给最终答案。模型自己就是个严格执行命令的“老实人”,你让想它就使劲想,不让想它就不过脑子。但微软这个Phi-4 15B不一样,它内置了一个判断机制,能自己评估眼前这个任务到底需不需要启动那个复杂的思考过程。

这功能听起来有点意思对吧?好处是可能特别“经济适用”。比如你问它“今天天气怎么样”,这种简单问题它可能直接就回答了,省了内部一堆不必要的计算,响应更快。但当你丢给它一道复杂的微积分题或者需要逻辑推理的谜题时,它自己就知道“这事儿不简单”,然后默默启动“思考模式”,一步步给你推演出结果。理论上,这能让它在速度和深度之间取得一个不错的平衡。

但这事儿也有另一面,就是可能有点“不可预测”。你没法完全控制它什么时候“走神”,什么时候“动真格”。万一它觉得某个问题很简单但其实很复杂,或者反过来,那就尴尬了。所以这个“自主决策思考”的功能到底实不实用、靠不靠谱,还得拉出来在真实世界里多溜溜,光看宣传不行。

除了这个“自动思考开关”,Phi-4 15B另外两个特点也挺值得说。第一是它训练起来特别“省饭”。微软说只用了2000亿个token的数据就把它喂饱了。这是个啥概念呢?现在市面上但凡个头还不错的AI模型,训练数据动不动就是上万亿token起跳。用这么“精简”的食谱能训出一个能用的模型,说明微软在数据质量和训练方法上可能有点独门秘诀。

第二,微软在训练它的时候,对“学习资料”特别挑食,只选高质量的内容。而且,他们还请了“外援”——用了GPT-4o来帮忙协助训练过程。理论上,这能让模型学到更优质的东西。但这里也有个有趣的点:用更强的AI(GPT-4o)来教一个较小的AI(Phi-4),效果到底如何,有时候也得看实际表现,不一定纸上谈兵都能赢。

说到实际表现,微软自己公布的基准测试结果挺真实的,有好有坏,没有只挑好的说。在和一些同级别或者稍大一点的开源多模态模型(LMM)比拼时,Phi-4 15B在某些测试项目上,确实能打赢比它参数更大的模型;但在另外一些项目上,它又会落后。这种“偏科”现象在AI模型里挺常见的。微软能把这些不那么完美的结果一起放出来,算是比较坦诚。当然啦,跑分归跑分,实际用起来是另一回事,这个咱们都懂。

可能很多人的注意力都被国内公司那些更知名的开源大模型(比如阿里的Qwen系列)吸引过去了,微软这个Phi系列模型在开源社区里讨论度没那么高。这也难怪,微软自己的重心好像更多是放在为那些最顶尖的第三方大模型(比如OpenAI的)提供云服务基础设施上,对自家这个“小儿子”的宣传力度没那么大。

但话说回来,这个Phi-4 15B说不定是个“小而美”的选择。你想啊,150亿的参数规模,对计算资源的要求相对友好,但在多项任务上表现还算扎实,还自带“思考节流阀”这种新奇功能。对于那些想尝试多模态应用,又不想在算力上投入太多的研究者或者开发者来说,它可能是个值得试试看的选项。

如果你对这个模型感兴趣,微软已经把所有的“开放权重”都公开了。你可以直接上Hugging Face或者Microsoft Foundry的页面去下载、研究甚至自己微调。更多的技术细节和那些测试的图表,微软的官方技术博客上都有。

所以总的来看,微软这次放出的Phi-4 15B,不像是个要颠覆市场的重磅力作,更像是一个展示了某种有趣技术思路的“特色产品”。它能不能在开源模型的激烈竞争中闯出一片天,还得看广大开发者和用户们实际用脚投票。但至少,它在“让AI自己决定如何思考”这条路上,又往前探了一步。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
发表于 5 天前 | 显示全部楼层
游客请登录后查看回复内容
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2026-3-10 03:16 , Processed in 0.093600 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2026 MyDigit.Net

快速回复 返回顶部 返回列表