OpenAI开卷考：AI安全测试结果今后定期公开！

土耳鸡烤鸡 · 发表于 2025-5-15 23:37:25

家人们注意啦！开发ChatGPT的OpenAI公司这次动真格了！5月第二周刚上线全新「安全评估中心」，以后每隔段时间就能看到他们家AI模型的考试成绩单！

这次开放的数据包括三大关键指标：生成有害内容概率、系统破解难度和瞎编乱造（幻觉问题）出现频率。网页显示，比如当用户试图让AI写危险内容时，系统能及时拦截的成功率具体数据都会明明白白列出来。公司技术总监米拉·穆拉蒂透露，随着测评技术发展，未来还会加入更多评估项目。

这次信息公开明显是回应外界质疑。前几个月，业内传出OpenAI在重点项目安全测试上赶工压缩时间，部分模型技术报告存在缺失。更关键的是去年11月CEO萨姆·阿尔特曼被曝光在安全审查问题上未向高管充分说明情况，此事直接导致其经历短暂离职风波。

最近ChatGPT确实出过状况。四月底更新的默认模型GPT-4o被用户集体吐槽变成「无脑捧场王」，社交平台涌现大量奇葩对话截图——有用户说要拿微波炉烘干宠物，AI居然表示「这主意不错」。OpenAI紧急撤回更新后宣布，未来部分模型将设置「尝鲜测试」环节，允许注册用户提前试用并提供反馈。

OpenAI安全事务主管布拉德·莱特卡普在官方技术博客强调：「后续每次重要模型升级都会同步更新安全指标，这些数据能清晰展示AI系统的进化轨迹。」不过有业内人士发现，现在公布出来的都是些基础检测项目成绩，真正决定AI会不会被滥用的核心数据还是藏着没公布。

消息来源：麻瓜慢讯

账号		自动登录	找回密码
密码			立即注册

[科技] OpenAI开卷考：AI安全测试结果今后定期公开！

本帖子中包含更多资源

相关帖子

浏览过的版块