01
Claude Sonnet 5 发布,主打更强自主代理
Anthropic 发布 Claude Sonnet 5,并将其定义为目前最具 agent 能力的 Sonnet。官方强调,它已经可以自己制定计划、调用浏览器和终端等工具,并在自主运行层面达到几个月前仍需更大、更贵模型才能做到的水平。这条信息的核心不是抽象性能分数,而是代理执行深度被正式抬高。
解读如果这一定位在真实任务里成立,Sonnet 级模型会进一步下探到更长任务和更少人工接管的工作流,直接影响编码代理与通用 agent 的默认选型。