继2025年12月发布GPT-Image-1.5之后,OpenAI正式推出ChatGPT Images 2.0,大幅增强其AI图像生成能力。新模型已在LM Arena AI上进行测试,可以生成具有长文本块的详细图像、逼真的用户界面,甚至可以重现现实生活中的人物,包括Sam Altman。
此次更新代表了 OpenAI 在处理视觉媒体方面的重大进步。 ChatGPT Images 2.0可以创建平面图、图像网格、角色模型,并将功能应用于用户上传的图像,这表明从仅将图像视为装饰转变为将图像理解为一种语言形式。
OpenAI 没有提供新模型的基准比较,但它声称性能符合“最先进”的功能,特别是与谷歌最近发布的 Nano Banana 2 模型相比,该模型也具有图像中的文本集成功能。报告表明 ChatGPT Images 2.0 在保真度和用户界面复制方面可能优于它。
作为其安全承诺的一部分,OpenAI 将在人工智能生成的图像中纳入元数据标记,以回应人们对人工智能技术在政治背景下可能被滥用的日益担忧。在最近的一次简报中,OpenAI 产品负责人 Adele Li 强调了该公司通过先进的安全协议采取的积极措施来防止政治干预。
更新后的模型结合了“O 系列”推理功能,使其能够在生成图像之前研究和考虑布局,从而增强其创建连贯的视觉叙事资产的能力。演示表明该模型可以合成复杂的文档并准确地再现地图,这标志着功能较之前的迭代有了飞跃。
Images 2.0 功能的结构支持高保真排版和多语言文本生成,解决人工智能生成图像中长期存在的问题。此迭代可以在非拉丁文字中生成连贯的文本,从而为全球用户提供增强的可访问性。
OpenAI 为此次部署制定了清晰的分层访问系统。免费用户将可以标准访问基本模型,而 Plus 和 Pro 用户可以访问高级功能,包括人工智能辅助推理以及通过单个提示生成保持连续性的多个图像的能力。
与之前的模型相比,API 开发者的定价结构有所下降。图像生成每个输入的成本为 8.00 美元,每个输出为 30.00 美元,而文本生成的输入成本为 5.00 美元,输出为 10.00 美元。向 ChatGPT Images 2.0 的转变表明 OpenAI 的方法面向企业采用,允许执行更复杂的创意任务,从而提高生产力。
为了应对日益激烈的竞争和技术进步,OpenAI 始终专注于提高用户安全和满意度,同时提供最先进的人工智能工具。随着 ChatGPT Images 2.0 功能的发展,该公司的目标是弥合人工智能艺术创作的意图差距,确保其满足用户需求和道德标准。
<小时/>








