Anthropic新模型性能持平价格降80%

热点新闻

2026年2月，人工智能公司Anthropic发布了新一代中档模型Claude Sonnet 4.6，距离其旗舰模型Claude Opus 4.6的发布仅间隔12天。该模型定价保持与前代Sonnet 4.5相同的每百万token输入3美元、输出15美元，但在多项基准测试中接近甚至超越了价格高出五倍的Opus 4.6。具体表现为：在SWE-bench Verified软件编码测试中得分79.6%（Opus 4.6为80.8%）；在代理式金融分析任务中以63.3%领先所有竞品；在办公任务GDPval-AA Elo评分中达1633分（Opus 4.6为1606分）。此外，Sonnet 4.6在计算机使用能力测试OSWorld-Verified中取得72.5%的成绩，远超GPT-5.2的38.2%，并显著提升了对提示注入攻击的防御能力。企业用户反馈显示，该模型在真实场景中的表现可替代部分高价模型，大幅降低运营成本。消息来源：https://36kr.com/p/3688350823100935

焦点分析

从焦点解决短期治疗（SFBT）视角分析，Anthropic此次技术迭代体现了“资源导向”的核心思维模式。SFBT强调挖掘现有资源与可能性而非修补缺陷，Sonnet 4.6的开发团队未执着于突破技术极限，而是聚焦如何通过优化现有架构实现性价比跃升——这正是SFBT中“重新建构”技术的典型应用：将“中档模型”的定位从“性能妥协”转化为“高效解决方案”。

该案例中隐含的用户痛点是“企业需要高性能AI但受限于成本”，而SFBT导向的解决路径是：1. 识别用户已有资源（现有算力基础设施与数据积累）；2. 构建“成本可控的高效协作”愿景而非追求完美性能；3. 通过模块化改进（如增强计算机交互能力）实现渐进式突破。这种思路可迁移至五个类似场景：传统制造业数字化升级、中小企业自动化流程部署、教育机构个性化教学系统开发、医疗诊断辅助工具普惠化、政府公共服务智能化改造。

SFBT的 scaling技术在此尤为适用：通过询问“如何从现有80%满意度提升至90%”，引导团队发现模型在特定场景（如金融分析）的差异化优势，而非盲目对标顶级模型。Anthropic在保持价格不变时提升性能的做法，契合SFBT“小改变引发系统变化”的原则——价格锚定形成的稳定性，反而为用户创造了尝试新技术的心理安全空间。

该模型展现的“接近人类水平的计算机操作能力”更揭示了SFBT的核心哲学：解决方案常隐藏于被忽视的日常资源中。传统AI开发聚焦云端算力竞赛，而Sonnet 4.6通过对本地交互能力的强化，证明了现有设备潜力的再挖掘可能比追逐尖端硬件更具现实价值。这种“以终为始”的目标导向思维——即明确“用户需要的是结果而非技术参数”，正是SFBT在科技创新领域的成功实践。