🚀 Claude Sonnet 5 上线，Managed Agents 六项增强补齐生产短板

jiangfengyuhuo · 2026 年7 月 1 日 02:40

Sonnet 5 的默认开启 adaptive thinking 将显著提升日常推理质量，而 Managed Agents 的增量流式预览和全生命周期 Webhooks 则直接解决了生产环境中的可观测性与用户体验痛点，是向企业级应用迈进的关键一步。

6 月 30 日，Anthropic 开发者平台发布 6 项更新，核心是 Claude Sonnet 5 模型上线（API model ID: claude-sonnet-5），以及 Managed Agents 的五项能力补强。Sonnet 5 是 Sonnet 4.6 的 drop-in 升级，拥有 1M token 上下文窗口和 128k 最大输出，但引入了三处 Breaking Change：Adaptive thinking 默认开启、手动 extended thinking 移除、采样参数不再接受非默认值。此外，新 tokenizer 会使 token 消耗增加约 30%，等效文本量的成本在促销期（至 8 月 31 日，$2/$10 每百万 token）后可能高于 Sonnet 4.6。迁移时需更换 model ID、删除旧参数，并用 token counting API 重新评估 prompt 成本。

Managed Agents 方面，事件流增量推送（event deltas）允许在 agent 生成回复时实时预览文本，改善前端渲染体验；会话级 Agent 配置覆写支持在创建 session 时临时覆盖模型、system prompt、工具等配置，便于 A/B 测试和临时调整；Webhooks 覆盖 Agent/Deployment/Run 全生命周期，新增 agent 版本发布、deployment 状态变更、run 失败等事件推送，无需轮询 API 即可监控生产环境。

其余两项增强包括：Session 列表支持向后分页（prev_page cursor），以及 Vault 环境变量凭证注入位置控制（可指定注入到请求头、请求体或两者）。这些更新共同将 Managed Agents 从“能跑”推向“能上生产”，结合此前上线的定时部署（scheduled deployments）和凭证管理，形成了完整的调度、执行与告警闭环。