数码之家

 找回密码
 立即注册
搜索
查看: 159|回复: 0

[科技] OpenAI发布GPT-4.5:参数规模再创新高 知识储备全面升级

[复制链接]
发表于 2025-2-28 18:55:49 | 显示全部楼层 |阅读模式
在代码仓库里修复bug、帮程序员设计新功能、撰写更严谨的学术报告——这些原本需要人类专家完成的任务,如今AI助手正在挑战更高难度。北京时间2月28日,OpenAI宣布推出GPT-4.5语言模型,这款基于GPT-4o架构扩展预训练规模的新作,以突破万亿参数的量级成为该公司迄今最大规模的知识载体。尽管官方明确表示该模型尚未达到前沿系统水平,但其在基础问答准确率、软件开发任务完成度等指标上的提升,正在重新定义AI助手的应用边界。

从官方披露的测试数据来看,GPT-4.5在软件开发类基准SWE-bench验证集上获得38%的准确率,较前代提升2-7个百分点,但与自家基于O3的深度研究方案仍存在30%的差距。相较之下,Anthropic公司的Claude 3.7 Sonnet模型在该测试中以62.3%的优异表现保持领先地位。

在基础问答能力方面,新模型展现出显著进步。SimpleQA准确率测试中,GPT-4.5以62.5%的得分超越前代38.2%的表现。更值得关注的是,该模型在SimpleQA幻觉率测试中创下OpenAI大模型系列的最低记录,显示出更强的信息可靠性。

针对软件工程实战场景,OpenAI预备团队开发的SWE-Lancer新基准显示,GPT-4.5能完成20%的独立开发任务和44%的技术管理任务。虽然相较o1模型仅有小幅提升,但展现出在真实工作场景中的应用潜力。目前该模型的完整系统说明文档已在官网公开。

安全评估方面,OpenAI安全顾问委员会将GPT-4.5归类为中等综合风险等级。具体来看,该模型在网络安全防护与自主行为控制两项指标上得分较低,显示出技术团队后续的优化方向。

从产品部署节奏来看,ChatGPT Pro用户即日起可通过网页端、移动端及桌面客户端的模型选择器体验GPT-4.5预览版。该版本已支持文件上传、图像解析及画布交互功能,而语音模式、视频处理等多模态能力将在后续更新中逐步开放。普通Plus用户与企业团队用户预计将于3月7日起获得访问权限。

对于开发者群体,GPT-4.5已全面接入聊天补全、助手编程和批量处理三大API接口。在保留函数调用、结构化输出、实时流传输等核心功能的基础上,新模型特别强化了系统消息处理能力。开发团队表示,此次升级聚焦于提升模型的知识深度与响应稳定性,而非追求参数规模的极限突破。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-4 01:34 , Processed in 0.234000 second(s), 9 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表