AI绘画模型 GPT-image-2 ,全面发布!

0 阅读1分钟

大家好,我是程序员小灰。

时间过得很快,转眼间AI绘画技术已经迭代了整整三年。

回想三年前,AI绘画是什么水平?那时候的AI作品当中,人物有六个手指头、左右脚分不清、文字全是乱码......

如今仅仅三年过去,AI绘画的水平已经跨越了好几个层级,尤其是2025年年末谷歌公司推出的Nano Banana Pro,更是成为了当时公认的最强AI绘画模型。

然而最近几天,OpenAI发布的一款全新AI绘画模型,彻底打破了Nano Banana Pro的王者地位。

这款模型就是 GPT-image-2,前几天该模型还处于灰度测试当中,现在它终于全面发布了!

这款新模型的生图水平究竟如何?今天就让我们从多个角度进行测评。

测试一:文字能力

首先来看一看GPT-image-2的文字能力如何,我们输入下面一组提示词:

“书桌上摆着两本摊开的书,一本书是小学语文课本,一本是小学数学课本,课本内容清晰,写实风格。”

很快,GPT-image-2 为我们生成了如下的结果:

大家可以看到,模型在同一张图里展示了数学和语文两个科目的相关文字内容,书页上几乎没有一个错别字,能做到如此程度真的很不容易!

如果一定要吹毛求疵的话,小灰觉得数学课本的内容进度有点太快了,前一页还在讲数字,后一页已经在讲图形了。

测试二:世界知识

接下来,我们让GPT-image-2完成一件更具挑战性的任务,来考验一下模型的民族文化认知能力。

提示词如下:

“在一张图里展现中国56个民族的全身服饰,新中式水墨风,9:16”

很快,GPT-image-2 为我们生成了如下的结果:

大家可以看到,图中展示出的民族不多不少,正好有56个,每一个民族的名称也完全正确。

唯一美中不足的是,个别几个民族的服饰与实际不符。

测试三、代码能力

看到这项测试,可能有小伙伴会问:“我们不是在测评AI绘画模型吗?跟代码能力有什么关系?”

别着急,大家看到后面生成的图片结果就明白了,提示词如下:

“在计算机博物馆里,一个程序员在展厅中央,正在演示C语言编程,很多参观者在围观,屏幕上的代码清晰可见。旁边的牌子写着:“古法编程,现场表演”。2D卡通画风,16:9”

很快,GPT-image-2 为我们生成了如下的结果:

大家可以看到,模型生成的卡通画面非常有质感,但这还不是最关键的。

不可思议的是,图中屏幕上的代码居然不是随意敷衍的乱码,而是正确可运行的C语言代码

测试四、漫画能力

众所周知,小灰的微信公众号是靠着漫画内容起家的,这次我们来测试一下 GPT-image-2 模型的漫画能力。

提示词如下:

“生成一页漫画,全面讲解Claude Code,漫画的主角是两只可爱的2D卡通小仓鼠,一只灰色,一只橙色。”

很快,GPT-image-2 为我们生成了如下的结果:

可以看到,漫画中的两只小仓鼠很可爱,讲的内容也很清晰。有了这样的AI模型,未来的教育行业要被改写了......

测试五:空间布局能力

最后一项测试,我们让 GPT-image-2 拆解一下男女程序员的穿搭元素,用以考验模型的空间布局能力和一致性保持能力。

提示词如下:

“用一张图拆解男程序员的穿搭风格,从物件名称,材质,价格等多个维度详细拆解,少用文字,多用图表达。”

很快,GPT-image-2 为我们生成了如下的结果:

大家可以看到,这张图全面拆解了男女程序员的穿搭元素,画面布局还不错,各个元素也基本保持了一致性。

好了,以上就是小灰对GPT-image-2模型的测评,每一项测评案例考查的不仅仅是模型的单一能力,更是解决实际问题的综合能力。

通过这几项测评,小灰可以明确地告诉大家,GPT-image-2绝对是当前最强大的AI绘画模型,没有之一!

2026年已经过去了三分之一,期待后续有更多强大的AI模型和AI工具诞生,为我们这些AI探索者带来更多的惊喜。