Anthropic祭出AI编程大杀器：Claude 4连续写代码7小时碾压人类程序员

土耳鸡烤鸡 · 发表于昨天 21:11

北京时间今天凌晨0点30分，Anthropic在技术发布会上正式发布全新Claude Opus 4与Claude Sonnet 4语言模型。这次升级完全瞄准程序员的工位：Opus 4在SWE-bench测试中解决真实GitHub问题的准确率飙至72.5%，更恐怖的是能持续生成代码近7小时，相当于人类程序员完整的工作日时长。

作为系列旗舰，Opus 4在三个维度重构AI能力边界。内存管理系统升级让上下文保留范围扩大两倍，配合内部规划算法迭代，处理复杂推理任务时像开了透视挂；终端代码生成测试（TerminalBench）43.2%的准确率看似不高，实则已超越多数初级开发者；Rakuten实验室实测数据显示，其自主执行任务时长从Claude 3 Opus的不足1小时暴增至6小时50分，足够完成中等规模软件模块开发。

面对"取代程序员"的质疑，Anthropic CTO Dario Amodei现场演示了Opus 4调试Python代码的过程：模型不仅能定位数组越界错误，还会自主插入断点测试，最后生成可视化日志分析。这种类人工作流验证了公司主张——AI不是替代工具，而是能分担70%重复劳动的"数字同事"。

定位亲民的Sonnet 4同样暗藏杀机。该模型虽在推理能力上稍逊，但通过架构优化实现20%的响应速度提升，免费用户通过Claude.ai就能调用。实测多文件代码导航功能时，模型仅用3秒就锁定某Java项目里的空指针异常，这种效率让线上编程教学平台开始重新设计课程体系。

技术架构层面，双模式设计堪称点睛之笔。"快速模式"处理简单问答仅需300毫秒，而"扩展思考模式"在运行复杂任务时会激活多层神经网络协作。更关键的是混合推理机制支持动态分配计算资源，云服务商透露，这能使企业AI运营成本降低37%。

目前Claude 4系列已登陆Amazon Bedrock和Google Cloud Vertex AI，金融、医疗等二十个行业的头部企业开始测试其自动化工作流。某硅谷工程师在社交媒体吐槽："现在压力最大的不是被AI取代，而是老板要求我们学会指挥AI写代码。"这场由7小时持续编码引发的变革，或许正在重塑整个软件工业的协作范式。

账号		自动登录	找回密码
密码			立即注册

[业界] Anthropic祭出AI编程大杀器：Claude 4连续写代码7小时碾压人类程序员

本帖子中包含更多资源

相关帖子

[业界] ​​Anthropic祭出AI编程大杀器：Claude 4连续写代码7小时碾压人类程序员​

本帖子中包含更多资源

相关帖子

[业界] Anthropic祭出AI编程大杀器：Claude 4连续写代码7小时碾压人类程序员