数码之家

 找回密码
 立即注册
搜索
查看: 49|回复: 0

[科技] OpenAI开卷考:AI安全测试结果今后定期公开!

[复制链接]
发表于 昨天 23:37 | 显示全部楼层 |阅读模式
家人们注意啦!开发ChatGPT的OpenAI公司这次动真格了!5月第二周刚上线全新「安全评估中心」,以后每隔段时间就能看到他们家AI模型的考试成绩单!

这次开放的数据包括三大关键指标:生成有害内容概率、系统破解难度和瞎编乱造(幻觉问题)出现频率。网页显示,比如当用户试图让AI写危险内容时,系统能及时拦截的成功率具体数据都会明明白白列出来。公司技术总监米拉·穆拉蒂透露,随着测评技术发展,未来还会加入更多评估项目。

这次信息公开明显是回应外界质疑。前几个月,业内传出OpenAI在重点项目安全测试上赶工压缩时间,部分模型技术报告存在缺失。更关键的是去年11月CEO萨姆·阿尔特曼被曝光在安全审查问题上未向高管充分说明情况,此事直接导致其经历短暂离职风波。

最近ChatGPT确实出过状况。四月底更新的默认模型GPT-4o被用户集体吐槽变成「无脑捧场王」,社交平台涌现大量奇葩对话截图——有用户说要拿微波炉烘干宠物,AI居然表示「这主意不错」。OpenAI紧急撤回更新后宣布,未来部分模型将设置「尝鲜测试」环节,允许注册用户提前试用并提供反馈。

OpenAI安全事务主管布拉德·莱特卡普在官方技术博客强调:「后续每次重要模型升级都会同步更新安全指标,这些数据能清晰展示AI系统的进化轨迹。」不过有业内人士发现,现在公布出来的都是些基础检测项目成绩,真正决定AI会不会被滥用的核心数据还是藏着没公布。

消息来源:麻瓜慢讯



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-16 06:17 , Processed in 0.140400 second(s), 8 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表