OpenAI 即将推出一种新的图像生成模型,广泛认为是 GPT Image 2,旨在生成更真实的视觉效果和更清晰的文本。这份基于 The Information 信息的报告强调了人工智能图像生成领域对谷歌和 Adob​​e 的竞争。

新模型遵循最近的社区测试和视频泄露。 4 月 4 日,LM Arena 上出现了三个型号,代号为 maskingtape-alpha、gaffertape-alpha 和 Packingtape-alpha。它们很快就被撤下,但截图却在 Reddit 上广泛流传。测试人员报告称,其近乎完美的文本渲染、原生 4K 分辨率支持和照片真实感在盲测中优于 Google 的 Nano Banana Pro。

据报道,这个新模型采用了全新的架构,与支持之前迭代、GPT Image 1 和 GPT Image 1.5 的 GPT-4o 图像管道不同。该设计还从两阶段推理转变为单遍生成,从而提高了质量和处理速度。到 4 月 14 日,这些模型重新出现在 LM Arena 上,一些 ChatGPT 用户注意到通过 A/B 测试在图像生成方面取得了改进。

OpenAI 宣布将于 5 月 12 日停止 DALL-E 2 和 DALL-E 3,这加剧了此次发布的紧迫性。随着 Adob​​e 将 OpenAI 和 Google 图像模型集成到其 Firefly 应用程序中,以及 Google 以其 Nano Banana Pro 模型设定基准,这些发展是在激烈的竞争中发生的。

OpenAI 最初于 2025 年 3 月发布了 GPT Image 1,随后于 12 月发布了具有增强渲染和编辑功能的 GPT Image 1.5。 GPT Image 1 实现了在第一周内生成超过 7 亿张图像的里程碑。

虽然 OpenAI 尚未确认 GPT Image 2 的发布时间表,但分析师预计将于 2026 年 4 月下旬至 5 月中旬之间发布,很可能与 GPT-5.4 更新一起发布。一位分析师表示:“竞争正在从简单的图像生成转向高实用性、多模式智能。”他强调了 OpenAI 和谷歌在人工智能领域不断演变的竞争。

<小时/>

精选图片来源

  苹果在 iOS 27 WWDC 上全面修改 Siri 计划 AI 聊天机器人揭晓