大家好,我是吾鳴。专注于分享提升工作与生活效率的工具,无偿分享AI领域相关的精选报告,持续关注AI的前沿动向。
这两天彻底的AI圈彻底的被GPT Image 2给炸锅了,Nano Banana 独领风骚了那么久,终于出现对手了,GPT Image 2的热度是呈现指数级的增长。
GPT Image 2是由OpenAI 在2026年4月最新发布的生图大模型,它一发布便在图像模型竞技场(Arena)上登顶榜首,并且在文生图的榜单上创下了最大的分差纪录。
吾鳴这两天也一直在使用GPT Image 2,并且把它接入到了扣子(Coze),用来生成吃货暴走地图,感兴趣的朋友可以看看我的上一篇文章——《GPT Image 2+扣子(Coze)一键生成吃货暴走地图,美食号的流量密码》。
本文我将把我这两天测试下来的结果来做一个分享,分别会从美感布局、世界知识理解、多图融合能力,文字处理和推理能力五个方面分享我对GPT Image 2的使用感受。
1. 美感布局
这一个部分主要是想看看GPT Image 2在生图方面对排版布局、图片用色等方面是否比较出众,让人看了生成的图片之后,色彩搭配是不是让人觉得是美丽的,布局是不是让人看着是舒服的。
1.1. 梦幻少女
让GPT Image 2给打造一个披满了水晶的梦幻少女。
奇幻奢华肖像,侧身优雅女性偏左构图,秋饰头饰,红枫菊花金丝宝石水晶玻璃长袍,深色长发,面部隐于阴影显神秘;环琥珀红橙玻璃圆框弧带,嵌珠宝水晶水滴,9 片浮枫飘落;落日金光发光山谷背景,远山秋林反光河流;暖橙铜金绯色调,极繁主义,超高细节,电影级背光,珠宝光效,宽幅构图,空灵耀眼,层次密集,焦外闪烁。
1.2. 电商详情页
我让GPT Image 2分别帮我生成“小米扫地机器人S40”、“华为 Mate XT三折叠手机”、“Nike Air Zoom”这三款产品的电商商品详情页。
为[产品名称]生成一个电子商务产品详情页面。
从这两个案例可以看到GPT Image 2无论是色彩的美感、还是在电商商品的详情布局设计上都是非常在线的,特别是梦幻少女,有点儿出乎我的意料,实在是太美了。
2. 世界知识理解
这个部分主要是想看看GPT Image 2是不是一个世界级的模型,对世界的知识是否都有充分的了解。
2.1. 手绘中华5000年
这个案例中我只给出一个主题,还有绘制图片的风格,但是中华上下5000年的内容不提供,让GPT Image 2自己去理解生成,看看它是否对这部分的知识有所了解。
手绘漫画风格,中华 5000 年发展时间线视觉图,整体清新可爱风,白色简约背景,时间线以国风红金渐变线条纵向延伸;标注10 个核心历史节点,每个节点配专属可爱 Q 版图标 + 10 字内简洁文案,图标线条圆润、色彩明快,与节点主题高度契合;节点文案字体为卡通楷体,红黑配色清晰易读;画面点缀祥云、卷轴、玉佩等国风小装饰,整体布局疏密有致,信息层级分明,童趣与国风融合,细节精致,适配高清展示,无杂乱元素,图片比例16:9。
2.2. 陈家祠自拍
对于城市的地标建筑,我想这些模型都没什么难度,所以选了一个非地标的景点,让两位偶像自拍一下,看看生成的图片效果如何。
马斯克和萨姆·奥特曼搭着肩在广州陈家祠景点门口前举着IPhone 16 Plus自拍,背景需要是广州陈家祠,写实摄影风格,图片比例是16:9,横屏
不得不说GPT Image 2生成图片的人像那真是一个真实,面部的褶皱感,马斯克的胡子,真看不出来是AI生成的。
背景部分,很久没有去过陈家祠了,对它有印象的朋友可以点评一下。
3. 多图融合能力
这个部分的测试主要是想看看GPT Image 2对多图片融合的能力支持的怎么样,因为这个能力关乎到一些想做电商服装模特图片生成的朋友,比较有实际落地的意义。
我是把我原先用来生成电商带货图片的工作流给修改了一下,让它可以支持GPT Image 2模型,用了扣子的工作流生成的图片。对这个工作流感兴趣的朋友可以看看我之前的文章——《 服装店老板狂喜!扣子Coze一键生成电商美女自拍图/视频,不用模特不用拍》
可以看看GPT Image 2来生成服装模特图片的效果。
从这两张图片来看,GPT Image 2的多图融合能力其实也是在线的,但是相比于Nano Banana 的多图融合能力还是稍微逊色了一些。
4. 文字处理
这个主要是想测试一些GPT Image 2生成的图片对中文文字的处理如何?是否会出现中文的乱码。
4.1. 知识卡片
知识卡片其实最能反应出一个模型对文字的支持力度怎么样,有没有乱码一眼便可以看出来。
16:9 横版手绘信息图卡片,米白纸质肌理背景,质朴亲切手绘风;上方红黑大号毛笔草书突出标题,内容分 2-4 小节,均为精炼中文草短语,字体流畅艺术、清晰可读;点缀简约趣味手绘小插画 / 图标,布局视觉平衡、留白适中,简洁易读;主题:做 IP 是长期复利,坚持每日出摊持续做,赢过 99% 半途而废的人
4.2. 手绘黑板报封面
这个案例的测试,我是使用了之前开发的一个扣子工作流——《扣子(Coze)实战:公众号爆款封面的秘密!20秒一张手绘黑板报,点赞率直接翻倍》。
我把这个工作流里面的Nano Banana Pro模型,替换成了GPT Image 2,然后输入了一段超长的文本,让GPT Image 2帮我提炼内容,绘制黑板报封面,生成的效果如下。
GPT Image 2在文字处理方面我个人觉得还是有了质的飞跃的,对于大字少字的卡片图,可以支持,但是如果是较多文字,同时很多小字的时候,会有小字崩塌的情况出现。
但是图片整体的风格、美感等还是在线的。
5. 推理能力
这个部分主要是想测试一下GPT Image 2到底是一个只会按照指令绘图的傻瓜,还是说它也会自己思考,然后根据任务推理出答案。
我给GPT Image 2提供一张有一道计算题的图片,并且跟它下达命令,要画一张草稿纸,然后草稿纸上需要写明这道计算题的解题过程。
然后下面是GPT Image 2给我生成的答案,返回的也是一张图片。
看着GPT Image 2的推理能力还挺强的,而且最后生成的解题过程也非常的赞。
6. 写到最后
经过对GPT Image 2来上这么些测试之后,对它的能力也算是有了个底。
总结来说就是美感、排版、布局、色彩等能力都是在线的,就是小字处理会有些崩塌,希望后续可以继续增强。
但是很多的场景其实都可以使用它来解决了,想海报设计,网页设计,绘制绝美的图片等。
好了,本文的分享就到这里,如果您觉得有收获的话,可以给个一键三连,您的鼓励是吾鳴持续输出的最大动力。