|
嘿,伙计们!OpenAI(开放人工智能研究中心)这次真弄出个让人开眼界的新玩意儿,感觉像给咱们每人配了个AI小帮手!就在今天,2025年7月18日,他们往自家顶流聊天机器人ChatGPT里塞了个叫“ChatGPT代理”的新技能。OpenAI的说法挺实在:这玩意儿能干好多电脑上的杂活累活,不用你自己动手了!
具体能干点啥呢?OpenAI举了些例子:它能帮你自动查看和安排你的日历,直接给你做出能修改的PPT幻灯片,甚至还能运行写好的代码。这意思就是,以后你想整点演示文稿或者处理点跟代码有关的麻烦事,可能张嘴跟ChatGPT说一声就成了,剩下的它帮你搞定。
这个“ChatGPT代理”本事不小,是OpenAI以前几个厉害工具的“私生子”。它继承了“Operator”那套自己打开网页点点戳戳的本事,也学来了“Deep Research”那种从几十个网站扒拉资料、最后给你总结成一份简明报告的手艺。用起来也简单得很,你想让它干嘛,就跟你平时跟朋友说话那样,直接打字跟ChatGPT讲就成。
想尝尝鲜?从今天开始,如果你已经花钱订阅了OpenAI的Pro、Plus或者Team这几个高级服务套餐,就能见到它了。怎么启动呢?在ChatGPT的工具下拉菜单里,戳那个写着“agent mode”(代理模式)的按钮就行。
OpenAI昨天(2025年7月17日)在他们的社交账号(X平台,以前叫推特)@OpenAI 上发了条推文吆喝这事儿:“ChatGPT如今可以用它自己的电脑给你干活啦!隆重介绍ChatGPT代理——这家伙融合了Operator的远程浏览操作、Deep Research的网页信息整合,还有咱ChatGPT最拿手的聊天对话本领。”推文配了个动图,挺吸引人眼球的。
这次ChatGPT代理的登场,可以看作是OpenAI最大胆的一次尝试了。他们想彻底把ChatGPT从一个只能陪聊天的“鹦鹉”,变成真能动手帮你办事儿的“实干家”。这几年,OpenAI、谷歌、还有Perplexity这些硅谷大厂前前后后发布了得有好几十款号称能干活的AI代理,可惜啊,早期的这些“打工人”们脑子稍微不够灵光,碰上稍微复杂点的任务就犯迷糊,用起来的效果跟老板们当初吹嘘的“替你分忧解难”差得有点远。
OpenAI自己倒挺有信心,拍着胸脯(此处为拟人化表达,但主体明确是公司行为)说这次新出的ChatGPT代理可比它家以前的那些“小工”强太多了。
它有个新本事挺亮眼,叫“ChatGPT连接器”。用上这个,你就能让它连上你的Gmail邮箱或者GitHub账号。这样一来,你随口问个事儿,比如“我上周那个项目邮件发谁了?”,它真能去你邮箱里扒拉出来回你!更厉害的是,OpenAI说这家伙还能用终端命令行,甚至能通过一些应用的接口(API)去操作这些应用,这权限可不小。
OpenAI官方给出了几个特别具体的任务设想,你能让它干:比如,“帮我计划和买齐四个人吃的日式早餐材料”,或者“给我研究分析三个竞争对手的情况,再做个专业的PPT”。各位瞅瞅,这些活儿可不是简单的问答,它得自己去不同的网站上找信息、盘算好每一步该干嘛、再动手用工具操作,复杂程度直接秒杀OpenAI以前让AI代理干的那些简单差事。
当然,光说能干没用,关键看能耐多大。OpenAI这次把测试成绩都亮出来了,看着还挺唬人。他们说给ChatGPT代理提供动力的新模型,在几个挺难的考试里成绩是目前最好的。
一个叫“人类终极测试”的变态大考,题目贼多,覆盖一百多个学科,好几千道题。ChatGPT代理在“第一次考试合格率”这项上考了41.6分(pass@1)。OpenAI自家之前挺厉害的o3和o4-mini模型在这考试里的成绩,撑死了也就20分出头,ChatGPT代理这分数基本是人家的快两倍了!
还有个叫“前沿数学”的数学考试,专门挑巨难的题考,是业内公认的地狱级难度。OpenAI说,当ChatGPT代理能用上电脑终端运行代码这些“小抄”时,能考到27.4分。在这之前,这测试的最高分还是OpenAI自己的o4-mini拿的,多少分呢?才6.3分!这差距,你说大不大?
不过,OpenAI自己也明白,这么能干的“打工人”万一被坏人利用了,那可就麻烦大了。所以这次他们老早就把“安全”俩字挂在了嘴边。
OpenAI专门为ChatGPT代理搞了份安全报告,里面说得挺明白:他们评估后认为,这个新模型在涉及生物和化学武器方面的能力等级属于“高风险”。按OpenAI自己的安全标准(叫“预备框架”),这就意味着它有能力让已有的危险途径变得更麻烦更严重。OpenAI坦率地说,虽然目前还没逮到实际坏事的证据,但为了保险起见,宁可多想一步,提前给这货加了几把“安全锁”。
新增的安全措施挺讲究。他们装了个“实时监控器”,只要你用着这代理,监控器就一直在旁边瞅着。你每输入一条指令,系统立马用个专门的分类器扫描一遍,看看你是不是在问跟生物相关的事。要是真涉及到生物话题,OpenAI会再把这代理准备回答的内容送进第二道监控,仔细查查有没有可能被别人拿去搞生物威胁。
还有个重要变动:OpenAI特意把这代理解除了“记忆功能”。平时聊天用ChatGPT,它能记着你之前聊过啥,方便继续话题。但这回在代理这儿,这功能给关了。为啥?OpenAI担心那些不怀好意的家伙,可能用“提示注入攻击”这种歪招,从记忆里套出敏感数据。OpenAI说了,以后也许会考虑重新开放,但现在,安全第一。
听着挺牛掰是吧?但话说回来,ChatGPT代理是骡子是马,还得拉出来遛遛才知道。毕竟之前的那些AI代理,碰到真刀真枪的现实世界任务,都暴露出了不够皮实、有点脆的问题。OpenAI这回敢说自家新模型不一样,真能把AI代理“解放生产力”的承诺给兑现了?咱们普通用户搬好小板凳,等着看它上线后的实际表现吧!
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|