数码之家

 找回密码
 立即注册
搜索
查看: 45|回复: 0

[业界] ​​Anthropic祭出AI编程大杀器:Claude 4连续写代码7小时碾压人类程序员​

[复制链接]
发表于 昨天 21:11 | 显示全部楼层 |阅读模式
北京时间今天凌晨0点30分,Anthropic在技术发布会上正式发布全新Claude Opus 4与Claude Sonnet 4语言模型。这次升级完全瞄准程序员的工位:Opus 4在SWE-bench测试中解决真实GitHub问题的准确率飙至72.5%,更恐怖的是能持续生成代码近7小时,相当于人类程序员完整的工作日时长。

作为系列旗舰,Opus 4在三个维度重构AI能力边界。内存管理系统升级让上下文保留范围扩大两倍,配合内部规划算法迭代,处理复杂推理任务时像开了透视挂;终端代码生成测试(TerminalBench)43.2%的准确率看似不高,实则已超越多数初级开发者;Rakuten实验室实测数据显示,其自主执行任务时长从Claude 3 Opus的不足1小时暴增至6小时50分,足够完成中等规模软件模块开发。

面对"取代程序员"的质疑,Anthropic CTO Dario Amodei现场演示了Opus 4调试Python代码的过程:模型不仅能定位数组越界错误,还会自主插入断点测试,最后生成可视化日志分析。这种类人工作流验证了公司主张——AI不是替代工具,而是能分担70%重复劳动的"数字同事"。

定位亲民的Sonnet 4同样暗藏杀机。该模型虽在推理能力上稍逊,但通过架构优化实现20%的响应速度提升,免费用户通过Claude.ai就能调用。实测多文件代码导航功能时,模型仅用3秒就锁定某Java项目里的空指针异常,这种效率让线上编程教学平台开始重新设计课程体系。

技术架构层面,双模式设计堪称点睛之笔。"快速模式"处理简单问答仅需300毫秒,而"扩展思考模式"在运行复杂任务时会激活多层神经网络协作。更关键的是混合推理机制支持动态分配计算资源,云服务商透露,这能使企业AI运营成本降低37%。

目前Claude 4系列已登陆Amazon Bedrock和Google Cloud Vertex AI,金融、医疗等二十个行业的头部企业开始测试其自动化工作流。某硅谷工程师在社交媒体吐槽:"现在压力最大的不是被AI取代,而是老板要求我们学会指挥AI写代码。"这场由7小时持续编码引发的变革,或许正在重塑整个软件工业的协作范式。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-24 11:25 , Processed in 0.140400 second(s), 10 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表