OpenAI 为其 Codex 编码工具推出了一款新的 macOS 应用程序,其中结合了允许 AI 代理独立处理编码任务的代理实践。此版本遵循代理软件开发的趋势,如 Claude Code 和 Cowork 等工具所示,其中大量代理和子代理执行大部分编程繁重工作。

该公司于 4 月份首次推出了 Codex 作为命令行界面,一个月后又推出了 Web 界面。周一发布的 macOS 应用程序支持并行运行多个代理。它集成了过去一年流行的代理技能和高级工作流程。

此次发布是在 OpenAI 发布 GPT-5.2-Codex 不到两个月后发布的,GPT-5.2-Codex 被称为其最强大的编码模型。 OpenAI 的目标是通过这种组合来吸引 Claude Code 等竞争对手的用户。

首席执行官 Sam Altman 在新闻发布会上谈到了该模型的功能。 “如果你真的想在复杂的事情上做复杂的工作,5.2 是迄今为止最强大的模型,”他说。 “然而,它更难使用,因此我们认为采用这种水平的模型功能并将其放入更灵活的界面中将非常重要。”

编码基准呈现出复杂的情况。 GPT-5.2 在 TerminalBench 上排名第一,该测试评估命令行编程任务上的人工智能性能。然而,Gemini 3 和 Claude Opus 的得分较低,但仍在基准误差范围内。在 SWE-bench 上测试人工智能修复现实世界软件错误的能力,结果显示 GPT-5.2 没有明显的优势。

代理用例仍然难以准确地进行基准测试。最先进模型的用户体验可能会有很大差异。

Codex macOS 应用程序引入了多项新功能。它允许后台自动化设置按计划运行,结果排队等待用户返回后查看。用户可以选择从务实到善解人意的座席性格,以适应他们的工作风格。

Altman 强调了该应用程序的开发速度。 “你可以用一张全新的白纸在几个小时内制作出一个非常复杂的软件,”他说。 “只要我输入新想法的速度足够快,这就是构建的极限。”

<小时/>

精选图片来源

  谷歌在 Galaxy S26 上更新了 Circle 来进行多对象扫描搜索