Anthropic 推出了 Sonnet 4.6,这是中型 Sonnet 模型的更新版本。此版本与公司四个月的更新周期一致。

该公司强调了 Sonnet 4.6 在编码、指令遵循和计算机使用功能方面的进步。该模型将作为 Anthropic 免费和专业计划用户的默认模型。

Sonnet 4.6 的测试版具有 100 万个令牌的上下文窗口。此容量是 Sonnet 之前可用容量的两倍。 Anthropic 表示,这个窗口可以容纳“整个代码库、冗长的合同或单个请求中的数十篇研究论文”。

此次发布是在两周前推出 Opus 4.6 之后进行的。预计在不久的将来会有更新的俳句模型。

Sonnet 4.6 记录了新的基准分数:

  • 供计算机使用的 OS World
  • 软件工程 SWE-Bench
  • 60.4% 的人支持 ARC-AGI-2(衡量人类特定智能技能的指标)

ARC-AGI-2 得分将 Sonnet 4.6 置于大多数同类模型之上。然而,它的排名低于 Opus 4.6、Gemini 3 Deep Think 和 GPT 5.2 的改进版本。

<小时/>

特色图片来源

  YouTube 将从 4 月 10 日开始免费直播 2026 年 Coachella 音乐节