APPSO
伴随着 IPO 预期升温,Anthropic 产品模型的节奏也愈发加快。
就在刚刚,Anthropic 接连发布两条重磅消息:一是将旗舰模型升级为 Claude Opus 4.8,二是完成 650 亿美元的 H 轮融资,投后估值达到 9650 亿美元,已逼近万亿美元关口。
对于一家估值已经逼近万亿美元的 AI 公司来说,市场要看的也不再只是模型跑分,而是它能否把智能、工具、开发环境、云平台和算力资源变成一套可规模化交付的基础设施。
换句话说,Anthropic 必须从一家交付好模型的公司,逐渐转向为一家试图重塑企业 AI 工作方式的公司。 加量不加价,Claude Opus 4.8 正式登场
此次发布的 Claude Opus 4.8,是 Anthropic 对旗舰模型 Opus 系列的一次升级。照目前这个模型发布节奏,用网友调侃的话来说,我们大概率能在 GTA 6 发布(不跳票的话,11 月)之前,率先看到 Claude Opus 6。
Anthropic 称,Opus 4.8 建立在 Opus 4.7 基础上,在编码、智能体任务、推理和知识工作等方面均有提升,并且已经面向用户开放,标准使用价格保持不变,仍为每百万输入 token 5 美元、每百万输出 token 25 美元。
开发者也可以通过 Claude API 使用 claude-opus-4-8。
API 价格对比
从官方披露的信息看,Opus 4.8 的改进覆盖编码、智能体能力、推理能力和实际知识工作任务。
Anthropic 在发布材料中用一张对比表展示了 Opus 4.8 与前代 Opus 4.7 以及其他模型在多项测试中的表现,当然,比起单次回答质量,模型的升级重点还是在长任务和复杂协作中的表现。
真实工作流里,模型往往需要连续处理多步任务,调用工具,检查中间结果,并根据反馈继续推进。Anthropic 表示,早期测试者认为 Opus 4.8 在执行智能体任务时更可靠,判断也更清晰。
Opus 4.8 在诚实性上的提升是一大亮点。
AI 模型常见的问题,是在证据不足时过早下判断,并自信声称已经取得进展。Anthropic 称,Opus 4.8 更愿意说明工作中的不确定性,也更少作出缺乏支撑的判断。
代码任务尤其能体现这种变化。
内部评估显示,Opus 4.8 让自己写出的代码缺陷未经说明地通过的概率,约为前代的四分之一。也就是说,新模型在发现风险时更可能提醒用户,而不是把问题留到后续测试或生产环境中。
在对齐和安全方面,Anthropic 延续了自己的核心叙事。Opus 4.8 在欺骗、配合滥用等不对齐行为上的发生率明显低于 Opus 4.7,并接近目前对齐表现最好的模型之一 Claude Mythos Preview。
安全、可靠、可控,仍然是 Anthropic 用来区分自身的一组关键词。随着 Claude 更深地进入企业流程,这些关键词也开始承担更多商业意义。
不过有意思的是,Opus 4.8 发布后,就被网友发现有些不对劲。
不少网友测试发现,当他们追问 Opus 4.8 的模型身份时,它给出的答案并不总是 Claude。
有时它会把自己认成 Qwen,有时又会报出 DeepSeek 的名字,疑似存在蒸馏的行为。
而当网友在 Claude 官方客户端里提出同样问题时,这类回答通常又不容易复现。原因大概率在于,客户端里的系统提示词和产品层约束更完整。
动态工作流上线,Claude Code 走向多 agents 协作
伴随 Claude Opus 4.8 一同上线的,还有多项产品和开发者功能。
其中,最直接影响 Claude 用户体验的当属 effort control,也就是思考强度调节。
控制项位于模型选择器旁边,顾名思义,用户可以决定 Claude 在一次任务中投入多少推理算力。较高强度下,Claude 会进行更多推理,以换取更好的回答质量;较低强度下,Claude 响应更快,使用额度消耗也更慢。
Anthropic 表示,Opus 4.8 默认采用 high effort,用户还可以选择 extra,在 Claude Code 中对应 xhigh,或者选择 max,让模型投入更多 token。Anthropic 建议,困难任务和长时间运行的异步工作流更适合使用 extra。
真正影响 Claude Code 产品形态的,是 dynamic workflows。
该功能目前处于 research preview,目标是让 Claude Code 处理过去需要更长工程周期的大规模任务。以往按季度规划的工作,现在甚至有机会在数天内完成。
dynamic workflows 的核心机制是,Claude 会根据用户任务动态编写 orchestration scripts,并在单个会话中运行数十到数百个并行 subagents。模型会先规划任务,再分配给多个 subagents,随后检查返回结果,最后向用户汇报。Opus 4.8 上线后,这些 agents 还可以运行更长时间。
该功能主要面向复杂、庞大或历史包袱较重的代码库。典型场景包括全服务范围内查找 bug、性能优化审计、安全审计、大型代码库迁移、框架替换、API 废弃迁移、语言移植,以及对关键方案进行多角度验证。
使用方式上,Anthropic 建议在 dynamic workflows 中打开 auto mode。用户可以直接要求 Claude 创建 workflow,也可以在 Claude Code 中打开 ultracode。ultracode 会把思考强度设为 xhigh,并让 Claude 自动判断当前任务是否适合使用 workflow。
dynamic workflows 当前已经在 Claude Code CLI、Desktop 和 VS Code extension 中开放,面向 Max、Team 和 Enterprise 套餐。其中 Enterprise 在发布时默认关闭,需要管理员在 Claude Code 设置中启用。
该功能也可用于 Claude API、Amazon Bedrock、Vertex AI 和 Microsoft Foundry。对于 Max、Team 用户,以及通过 API 使用 Claude Code 的用户,dynamic workflows 默认开启。 千映智智商测试
除了 Claude Code,Anthropic 还更新了 Messages API。现在,Messages API 可以在 messages array 内接受 system entries。
开发者可以在任务执行过程中更新 Claude 的指令,同时不破坏 prompt cache,也不必通过 user turn 传递更新。这一能力可用于 agent 运行时更新权限、token 预算或环境上下文。
下一步,Anthropic 还计划推出一个比 Opus 智能水平更高的新模型类别。没错就是那个强的可怕的 Claude Mythos Preview,预计未来数周内可以把 Mythos class models 带给所有客户。
到时候,我们也将第一时间尝尝咸淡。 近万亿美元估值背后,Claude 需要更大的算力底座
与 Claude Opus 4.8 同日发布的另一条消息,是 Anthropic 完成 650 亿美元 H 轮融资。本轮由 Altimeter Capital、Dragoneer、Greenoaks 和 Sequoia Capital 领投,投后估值达到 9650 亿美元。