OpenAI 推出 ChatGPT Images 2.0,对标谷歌 Nano Banana 2

0 阅读2分钟

2025 年初,OpenAI 为 ChatGPT 进行了一次重大的图像生成升级,推出的新模型迅速走红。该模型被证明是该公司的一大成功,据报道还为 ChatGPT 带来了数百万新用户。

随后在 2025 年 4 月,OpenAI 通过 gpt-image-1 API 将同样的图像生成技术开放给了开发者。接着在 2025 年 12 月,公司又发布了 gpt-image-1.5,该版本在前代基础上有了显著改进。

ChatGPT Images 2.0

另一方面,谷歌自去年 9 月以来一直在陆续推出其 Gemini Nano Banana 系列图像生成模型。今年早些时候,谷歌宣布了 Nano Banana 2(也称为 Gemini 3.1 Flash Image),这是一个最先进的图像模型,以显著的改进提供了 Nano Banana Pro 级别的图像质量。

为了迎战 Gemini Nano Banana 2,OpenAI 于今日推出了 ChatGPT Images 2.0。在一场直播中,OpenAI 首席执行官萨姆·奥尔特曼(Sam Altman)等人展示了新模型的能力。OpenAI 表示,ChatGPT Images 2.0 在生成包含文本的图像方面表现显著提升。例如,用户现在可以创建 macOS 桌面窗口或聊天界面的图像,其中的文本渲染得更加准确。

OpenAI 称,Images 2.0 能够更紧密地遵循指令、保留所要求的细节,并准确渲染细粒度元素,例如小字号文本、图标、用户界面组件、密集的构图以及细微的风格限制。新模型还能以多种纵横比(从 3:1 的宽屏到 1:3 的竖屏)生成高达 2K 分辨率的图像。

Images 2.0 模型将有两个版本:

ChatGPT Images 2.0 instant

ChatGPT Images 2.0 thinking

当在 ChatGPT 中选择 thinking 或 Pro 模型时,Images 2.0 可以参考网络获取与查询相关的实时信息,然后生成更准确的图像。它还可以根据单个提示词创建多张不同的图像,并自我复核其输出结果。

最后,Images 2.0 拥有更强的多语言理解能力,现在在渲染非拉丁文本方面表现更好,包括日语、韩语、中文、印地语和孟加拉语。

gpt-image-2 模型已通过 API 向开发者开放,定价如下:

输入:8.00 美元

缓存输入:2.00 美元

输出:30.00 美元

ChatGPT Images 2.0 instant 模型现已面向所有 ChatGPT 和 Codex 用户开放,而 ChatGPT Images 2.0 thinking 模型则保留给 ChatGPT Plus、Pro 和 Business 用户使用。