微软放出Phi-4 15B：会自己决定什么时候“动脑子”的AI

麻薯滑芝士 · 发表于 5 天前

各位捣鼓AI模型、跑开源项目的老铁们，还有那些对“AI到底咋思考的”这事儿特别好奇的技术宅们，放下你们手里正在微调的代码，来瞅瞅微软刚刚整出来的新花样。就在昨天，3月4号，微软不声不响地丢出来一个名叫Phi-4 15B的新模型，这消息是海外科技媒体Neowin报的。光听名字你可能觉得，哦，又是一个开源模型呗。但这次，微软在这个小家伙身上塞了个挺贼的功能，让它干了一件很多比它大得多的模型都不太会干的事儿——它居然能自己决定，什么时候该“认真想想”，什么时候可以直接“秒回”。

这玩意儿全名叫“Phi-4-reasoning-vision-15B”，是个150亿参数的“多模态”模型。简单说就是，它既能看懂图片给你描述内容，能在软件界面上精准定位一个按钮，还能处理挺复杂的数学题。参数规模15B，在动辄几百B、上千B的模型世界里不算巨无霸，但微软这次玩的是“巧劲儿”。

它最核心的那个卖点，我得多唠两句。平常咱们用大多数AI模型，尤其是开源的这些，你得手动给它下命令：要么你让它开启“思考模式”（Chain-of-Thought），让它一步一步推导给你看；要么你就让它直接给最终答案。模型自己就是个严格执行命令的“老实人”，你让想它就使劲想，不让想它就不过脑子。但微软这个Phi-4 15B不一样，它内置了一个判断机制，能自己评估眼前这个任务到底需不需要启动那个复杂的思考过程。

这功能听起来有点意思对吧？好处是可能特别“经济适用”。比如你问它“今天天气怎么样”，这种简单问题它可能直接就回答了，省了内部一堆不必要的计算，响应更快。但当你丢给它一道复杂的微积分题或者需要逻辑推理的谜题时，它自己就知道“这事儿不简单”，然后默默启动“思考模式”，一步步给你推演出结果。理论上，这能让它在速度和深度之间取得一个不错的平衡。

但这事儿也有另一面，就是可能有点“不可预测”。你没法完全控制它什么时候“走神”，什么时候“动真格”。万一它觉得某个问题很简单但其实很复杂，或者反过来，那就尴尬了。所以这个“自主决策思考”的功能到底实不实用、靠不靠谱，还得拉出来在真实世界里多溜溜，光看宣传不行。

除了这个“自动思考开关”，Phi-4 15B另外两个特点也挺值得说。第一是它训练起来特别“省饭”。微软说只用了2000亿个token的数据就把它喂饱了。这是个啥概念呢？现在市面上但凡个头还不错的AI模型，训练数据动不动就是上万亿token起跳。用这么“精简”的食谱能训出一个能用的模型，说明微软在数据质量和训练方法上可能有点独门秘诀。

第二，微软在训练它的时候，对“学习资料”特别挑食，只选高质量的内容。而且，他们还请了“外援”——用了GPT-4o来帮忙协助训练过程。理论上，这能让模型学到更优质的东西。但这里也有个有趣的点：用更强的AI（GPT-4o）来教一个较小的AI（Phi-4），效果到底如何，有时候也得看实际表现，不一定纸上谈兵都能赢。

说到实际表现，微软自己公布的基准测试结果挺真实的，有好有坏，没有只挑好的说。在和一些同级别或者稍大一点的开源多模态模型（LMM）比拼时，Phi-4 15B在某些测试项目上，确实能打赢比它参数更大的模型；但在另外一些项目上，它又会落后。这种“偏科”现象在AI模型里挺常见的。微软能把这些不那么完美的结果一起放出来，算是比较坦诚。当然啦，跑分归跑分，实际用起来是另一回事，这个咱们都懂。

可能很多人的注意力都被国内公司那些更知名的开源大模型（比如阿里的Qwen系列）吸引过去了，微软这个Phi系列模型在开源社区里讨论度没那么高。这也难怪，微软自己的重心好像更多是放在为那些最顶尖的第三方大模型（比如OpenAI的）提供云服务基础设施上，对自家这个“小儿子”的宣传力度没那么大。

但话说回来，这个Phi-4 15B说不定是个“小而美”的选择。你想啊，150亿的参数规模，对计算资源的要求相对友好，但在多项任务上表现还算扎实，还自带“思考节流阀”这种新奇功能。对于那些想尝试多模态应用，又不想在算力上投入太多的研究者或者开发者来说，它可能是个值得试试看的选项。

如果你对这个模型感兴趣，微软已经把所有的“开放权重”都公开了。你可以直接上Hugging Face或者Microsoft Foundry的页面去下载、研究甚至自己微调。更多的技术细节和那些测试的图表，微软的官方技术博客上都有。

所以总的来看，微软这次放出的Phi-4 15B，不像是个要颠覆市场的重磅力作，更像是一个展示了某种有趣技术思路的“特色产品”。它能不能在开源模型的激烈竞争中闯出一片天，还得看广大开发者和用户们实际用脚投票。但至少，它在“让AI自己决定如何思考”这条路上，又往前探了一步。

zrx166 · 发表于 5 天前

游客请登录后查看回复内容

账号		自动登录	找回密码
密码			立即注册

[科技] 微软放出Phi-4 15B：会自己决定什么时候“动脑子”的AI

本帖子中包含更多资源

相关帖子

浏览过的版块