数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 198|回复: 0

[科技] Claude 4双雄登场 大模型赛道迎来新标杆

[复制链接]
发表于 2025-5-24 21:30:51 | 显示全部楼层 |阅读模式
AI江湖又起风云!OpenAI的老对手Anthropic近日甩出两张王牌——Claude Opus 4和Claude Sonnet 4。这对模型兄弟在编码能力和自主任务处理上展现惊人实力,直接叫板谷歌Gemini和ChatGPT。

先说性价比担当Claude Sonnet 4,这款轻量级模型专攻日常任务处理。它能以较低的计算成本快速完成代码生成、数据分析等常规操作,API调用费用比同类产品便宜三成。Anthropic公布的基准测试显示,该模型在HackerRank编程挑战中正确率高达89%,比前代提升15个百分点。

真正的大杀器是旗舰款Claude Opus 4,这个被官方称为"镇司之宝"的模型在自主运行时长上创下纪录。实测中,它能在无人干预情况下连续处理复杂代理任务超过4小时。举个具体场景:接到"整理季度财报并生成分析报告"指令后,模型可自主完成数据抓取、清洗、可视化及趋势预测整套流程。

编码能力是这对兄弟的“拿手菜”。在Anthropic提供的对比图表中,Opus 4在CodexGLUE测试集上的表现超越谷歌Gemini 2.5 Pro三个百分点。虽然测试数据来自厂商自家报告,但这个差距在AI竞赛白热化的当下已属显著优势。

想尝鲜的开发者可通过Amazon Bedrock、Google Cloud Vortex AI等云平台获取API接口。普通用户则需要订阅每月20美元起的Claude Pro服务,不过Sonnet 4目前仍对免费用户开放。值得注意的是,Opus 4的多轮对话成本比Sonnet高出70%,更适合企业级复杂场景。

随着AI代理(Agent)技术成为新战场,Anthropic这波操作可谓精准卡位。Opus 4展现的持续任务处理能力,让通用人工智能(AGI)的轮廓愈发清晰。下次当你看到电脑自动调试代码时,可能不再是程序员在远程操控,而是某个大模型正在默默练级。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-7-21 23:43 , Processed in 0.109201 second(s), 10 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表