Anthropic 周一宣布推出 Claude Sonnet 4.5,这是一种新的前沿模型,该公司声称在编码基准测试中提供了最先进的性能。该公司表示,该模型可以构建“生产就绪”的应用程序,与之前的人工智能模型相比,可靠性有所提高。 Claude Sonnet 4.5 可通过 Claude API 和 Claude 聊天机器人访问,开发者的定价与 Claude Sonnet 4 相同:每百万输入代币 3 美元,每百万输出代币 15 美元。
Anthropic 的人工智能模型被开发者和企业使用,有报道称苹果和 Meta 在内部使用它们。该公司还销售对 AI 编码应用程序(例如 Cursor、Windsurf 和 Replit)的 API 访问权限。在此发布之前,最近有报道称 OpenAI 的 GPT-5 在多个编码基准测试中超越了 Anthropic 的模型,从而对它们提出了挑战。
据 Anthropic 称,Claude Sonnet 4.5 在 SWE-Bench Verified 等基准测试中实现了行业领先的性能。 Anthropic AI 研究员 David Hershey 表示,仅靠基准测试结果并不能体现该模型的全部功能。 Hershey 报告称,在企业客户的早期试验中,可以自主观察模型代码长达 30 个小时。在这些会话中,AI 构建了一个应用程序、设置了数据库服务、购买了域名并执行了 SOC 2 审核。 Cursor 首席执行官 Michael Truell 将 Claude Sonnet 4.5 描述为“最先进的编码性能,特别是在长期任务上”。 Windsurf 首席执行官 Jeff Wang 将该模型称为“新一代编码模型”。
Anthropic 还声称 Claude Sonnet 4.5 是其迄今为止最一致的前沿人工智能模型,与前任相比,阿谀奉承和欺骗的比率更低。该公司表示,它已经提高了该模型对即时注入攻击的抵抗力。








