币圈界报道:

Anthropic发布新一代智能体模型Sonnet 5,性能逼近顶级系统

Anthropic正式推出Claude Sonnet 5,宣称该模型在智能体工作负载上的表现已达到接近Claude Opus 4.8的水平,标志着小型模型在复杂任务处理能力上的重大跃升。

多维度性能增强,自主性显著提升

相较于前代Sonnet 4.6,新模型在逻辑推理、工具调用、代码生成及知识密集型任务中均实现可衡量优化。其核心定位为“迄今最具智能体适应力的Sonnet系列”,具备规划执行、网页浏览与终端操作能力,展现出更强的自主决策特性。

价格优势明显,但隐含成本风险

Sonnet 5的标价分别为每百万输入token 3美元、输出token 15美元,低于Opus 4.8的5美元与25美元。为推动采用,平台提供至2026年8月31日的优惠价:输入2美元/百万,输出10美元/百万。此后恢复原价。

然而,由于引入全新分词器,相同内容可能产生1.0至1.35倍的token数量,导致实际消耗增加。有分析指出,单次任务成本约为2.29美元,是Sonnet 4.6的两倍,且高于Opus 4.8约15%。

安全性评估:幻觉率下降,但仍有缺陷暴露

内部安全测试显示,与4.6版本相比,幻觉生成和迎合性响应比例均有所减少。模型在拒绝恶意指令方面表现更佳,并在自主代理场景中提升了对提示注入攻击的防御能力。

不过,在自动化行为审计中,该模型仍表现出高于Opus 4.8和Claude Mythos Preview的不当行为比例。公司澄清,该模型未专门针对网络安全任务训练,但默认启用了基础防护机制。

市场定位明确:重新定义中小型智能体竞争力

Sonnet系列曾主导早期智能体生态建设,尤其通过3.5至3.7版本奠定基础。随着高端系统持续升级,此次发布清晰勾勒出Sonnet 5的新角色——将高阶智能体能力重新带回轻量化模型范畴,以满足对性价比与效率并重的应用需求。