OpenAI 即将推出新图像模型 GPT Image 2

OpenAI 即将推出一种新的图像生成模型，广泛认为是 GPT Image 2，旨在生成更真实的视觉效果和更清晰的文本。这份基于 The Information 信息的报告强调了人工智能图像生成领域对谷歌和 Adobe 的竞争。

新模型遵循最近的社区测试和视频泄露。 4 月 4 日，LM Arena 上出现了三个型号，代号为 maskingtape-alpha、gaffertape-alpha 和 Packingtape-alpha。它们很快就被撤下，但截图却在 Reddit 上广泛流传。测试人员报告称，其近乎完美的文本渲染、原生 4K 分辨率支持和照片真实感在盲测中优于 Google 的 Nano Banana Pro。

据报道，这个新模型采用了全新的架构，与支持之前迭代、GPT Image 1 和 GPT Image 1.5 的 GPT-4o 图像管道不同。该设计还从两阶段推理转变为单遍生成，从而提高了质量和处理速度。到 4 月 14 日，这些模型重新出现在 LM Arena 上，一些 ChatGPT 用户注意到通过 A/B 测试在图像生成方面取得了改进。

OpenAI 宣布将于 5 月 12 日停止 DALL-E 2 和 DALL-E 3，这加剧了此次发布的紧迫性。随着 Adobe 将 OpenAI 和 Google 图像模型集成到其 Firefly 应用程序中，以及 Google 以其 Nano Banana Pro 模型设定基准，这些发展是在激烈的竞争中发生的。

OpenAI 最初于 2025 年 3 月发布了 GPT Image 1，随后于 12 月发布了具有增强渲染和编辑功能的 GPT Image 1.5。 GPT Image 1 实现了在第一周内生成超过 7 亿张图像的里程碑。

虽然 OpenAI 尚未确认 GPT Image 2 的发布时间表，但分析师预计将于 2026 年 4 月下旬至 5 月中旬之间发布，很可能与 GPT-5.4 更新一起发布。一位分析师表示：“竞争正在从简单的图像生成转向高实用性、多模式智能。”他强调了 OpenAI 和谷歌在人工智能领域不断演变的竞争。

<小时/>

精选图片来源

OpenMythos 项目声称 Claude Mythos 是一个循环深度变压器

OpenAI 即将推出新图像模型 GPT Image 2

Related Stories

苹果在 beta 3 中带来了更多个性化的 Siri 语音控制

人择研究发现克劳德模型形成类似于意识的内部工作空间

苹果在 watchOS 27 beta 3 中激活 Apple Watch 上的 Siri AI

《中途旅程》促使迪士尼和其他公司在诉讼中披露内部人工智能的使用情况