Anthropic 推出 Claude Sonnet 4.5 并进行了编码升级

Anthropic 周一宣布推出 Claude Sonnet 4.5，这是一种新的前沿模型，该公司声称在编码基准测试中提供了最先进的性能。该公司表示，该模型可以构建“生产就绪”的应用程序，与之前的人工智能模型相比，可靠性有所提高。 Claude Sonnet 4.5 可通过 Claude API 和 Claude 聊天机器人访问，开发者的定价与 Claude Sonnet 4 相同：每百万输入代币 3 美元，每百万输出代币 15 美元。

Anthropic 的人工智能模型被开发者和企业使用，有报道称苹果和 Meta 在内部使用它们。该公司还销售对 AI 编码应用程序（例如 Cursor、Windsurf 和 Replit）的 API 访问权限。在此发布之前，最近有报道称 OpenAI 的 GPT-5 在多个编码基准测试中超越了 Anthropic 的模型，从而对它们提出了挑战。

据 Anthropic 称，Claude Sonnet 4.5 在 SWE-Bench Verified 等基准测试中实现了行业领先的性能。 Anthropic AI 研究员 David Hershey 表示，仅靠基准测试结果并不能体现该模型的全部功能。 Hershey 报告称，在企业客户的早期试验中，可以自主观察模型代码长达 30 个小时。在这些会话中，AI 构建了一个应用程序、设置了数据库服务、购买了域名并执行了 SOC 2 审核。 Cursor 首席执行官 Michael Truell 将 Claude Sonnet 4.5 描述为“最先进的编码性能，特别是在长期任务上”。 Windsurf 首席执行官 Jeff Wang 将该模型称为“新一代编码模型”。