🚀 Claude Sonnet 5 上线,Managed Agents 六项增强补齐生产短板

Sonnet 5 的默认开启 adaptive thinking 将显著提升日常推理质量,而 Managed Agents 的增量流式预览和全生命周期 Webhooks 则直接解决了生产环境中的可观测性与用户体验痛点,是向企业级应用迈进的关键一步。

6 月 30 日,Anthropic 开发者平台发布 6 项更新,核心是 Claude Sonnet 5 模型上线(API model ID: claude-sonnet-5),以及 Managed Agents 的五项能力补强。Sonnet 5 是 Sonnet 4.6 的 drop-in 升级,拥有 1M token 上下文窗口和 128k 最大输出,但引入了三处 Breaking Change:Adaptive thinking 默认开启、手动 extended thinking 移除、采样参数不再接受非默认值。此外,新 tokenizer 会使 token 消耗增加约 30%,等效文本量的成本在促销期(至 8 月 31 日,$2/$10 每百万 token)后可能高于 Sonnet 4.6。迁移时需更换 model ID、删除旧参数,并用 token counting API 重新评估 prompt 成本。

Managed Agents 方面,事件流增量推送(event deltas)允许在 agent 生成回复时实时预览文本,改善前端渲染体验;会话级 Agent 配置覆写支持在创建 session 时临时覆盖模型、system prompt、工具等配置,便于 A/B 测试和临时调整;Webhooks 覆盖 Agent/Deployment/Run 全生命周期,新增 agent 版本发布、deployment 状态变更、run 失败等事件推送,无需轮询 API 即可监控生产环境。

其余两项增强包括:Session 列表支持向后分页(prev_page cursor),以及 Vault 环境变量凭证注入位置控制(可指定注入到请求头、请求体或两者)。这些更新共同将 Managed Agents 从“能跑”推向“能上生产”,结合此前上线的定时部署(scheduled deployments)和凭证管理,形成了完整的调度、执行与告警闭环。