GPT Image 2 VS 香蕉:6 组提示词实测对比

0 阅读9分钟

事情是这样的。

OpenAI 发了新的文生图模型,群里这两天一直在聊,说 GPT Image 2 开始灰度了。Plus 号也有机会被灰到,你直接在 ChatGPT 里生成一张图试试,中文不是乱码的话,恭喜,你就是天选之子。

GPT Image 2 灰度测试

我鬼使神差地打开 ChatGPT 试了一下,还真被灰到了。

那我肯定得测一测。刚好 X 上有个网友 @mirroraoaoao 发了 6 组很刁钻的提示词,覆盖了海报、电商、摄影、信息图、人像一致性、参考图二创六个方向,我拿来当考题,让 GPT Image 2 和 Lovart 上的 Nano Banana 2、Nano Banana Pro 一起做。

三个模型,同一套题,看谁扛得住。

结果,有点出乎我意料。

第一组,奶茶海报

提示词丢过去,要求出一张新中式茶饮品牌「山川茶事」的海报,要带完整的中文字体排版、价格、活动信息,还得有品牌感。

🔻 GPT Image 2 奶茶海报

🔻 Nano Banano 2 奶茶海报

🔻Nano Banano Pro 奶茶海报

怎么说呢,GPT Image 2 这张我一看到就觉得,这玩意真的能直接拿去印了。排版克制,留白到位,字体选得也有品味。Nano Banana Pro 的那张也还行,但总觉得信息堆得太满,少了点「呼吸感」。

第二组,电商护肤品首图

这组是高端精华液的电商主图,要求磨砂玻璃瓶身、卖点价格赠品全铺上去,还得有「天猫旗舰店」那种调性。

🔻 GPT Image 2 护肤品首图

🔻 Nano Banano 2 护肤品首图

🔻 Nano Banano Pro 护肤品首图

这组差距就开始明显了。GPT Image 2 的瓶身质感、光影处理,真的有种「这不是 AI 画的吧」的错觉。香蕉这边吧,该有的信息都有,但就是少了那一口「高级气」。

第三组,真实生活摄影

这组我特别感兴趣,要求出一张商场抓拍照,亚洲男性,扶梯口,混合光源,要有「纪实摄影」的真实感。这种要求对 AI 来说是地狱难度,因为太容易露馅了。

🔻 GPT Image 2 生活摄影

🔻 Nano Banano 2 生活摄影

🔻 Nano Banano Pro 生活摄影

我放大看了好一会儿。

GPT Image 2 那张,头发略乱、脸上出油感、鞋面磨损、购物袋折痕,该有的生活痕迹都有。Nano Banana 的也不差,但看久了你会发现人物的皮肤质感还是太「干净」了,少了点真实生活中那种粗糙感。

第四组,高密度信息图

这组是繁杂可爱风格的信息图,要把 Qwen3.6 的发布信息塞进去,人物还得用参考图里的。信息密度拉满,排版要求极高。

🔻 GPT Image 2 信息图

🔻 Nano Banano 2 信息图

🔻Nano Banano Pro 信息图

这组香蕉扳回一城。Nano Banana Pro 那张信息密度和可爱感都拉满了,一眼看上去就是那种「社交媒体上会被疯狂转发」的图。GPT Image 2 呢,稳是稳,但少了点「骚劲」。

第五组,小姐姐九宫格

这组测的是人物一致性,要求同一个女生九种表情,发型服装全得一致,不能每格像不同的人。

🔻 GPT Image 2 九宫格

🔻 Nano Banano 2 九宫格

🔻 Nano Banano Pro 九宫格

实测下来 GPT 生成的小姐姐都是妆后,颜值更高,皮肤磨得跟剥壳鸡蛋似的。香蕉这边偏素颜,更真实,但坦率的讲一致性稍逊一筹,有几格看着像换了个姐妹。

第六组,宠物联名海报

最后一组,给一只猫做肯德基联名海报。先放参考图,看看原图长啥样。

宠物参考图

然后是三个模型的答卷。

🔻 GPT Image 2 宠物联名海报

🔻 Nano Banano 2 宠物联名海报

🔻 Nano Banano Pro 宠物联名海报

这组其实挺能看出各家功力的。GPT Image 2 的猫和原图最像,联名感做得也地道。香蕉的配色更炸裂,但猫脸的一致性就。。。你懂。

总结

六组跑完,我自己的感受是,这俩根本不是同一种选手,硬分高下没太大意义。

GPT Image 2 的图,第一眼未必炸。但多看几秒你会发现,它懂克制。留白稳,细节往真实感上靠。很多图你盯着看,会觉得「这东西好像能直接拿去用」。审美在线,指令遵从也更听话。

Nano Banana 呢?快。信息密。第一眼就能打人。

所以我的结论很简单。要品牌感、产品感、拿出去不丢人的精致度,偏 GPT Image 2。要快出图、先声夺人,香蕉也值得留着。

最好的状态?两个都留着,各取所长。

附:完整提示词

01 中文长文本海报

请设计一张 3:4 竖版中文茶饮新品上市海报,品牌名为「山川茶事」。整体风格新中式、克制、轻奢,色彩以墨绿、米白、金色为主,融入宣纸肌理、留白、淡雅山水、现代版式设计。画面主体是一杯高颜值冷泡茶,搭配茶叶、西柚、冰块、金箔元素。海报要兼具商业感与审美感,看起来像真实品牌宣传海报,不要像廉价电商图。 海报中必须准确呈现以下全部文字: 山川茶事 山柚观音 冷泡系列 新品上市 一口清醒,半城入夏 限定尝鲜价 中杯 16 元 大杯 19 元 门店活动 第二杯半价 加 3 元升级轻乳版 每日前 100 名赠限定杯套 推荐风味 观音茶底 / 西柚果香 / 轻乳云顶 / 冰感回甘 活动时间 4月20日 至 5月10日 扫码点单 SHANCHUAN TEA 底部小字: 图片仅供参考,请以门店实际售卖为准 要求重点测试中文标题、小字、价格数字、信息模块、层级排版与字体美感。不要生成手机外框,不要过度卡通化。

02 电商护肤品首图

生成一张高端护肤品电商首图海报,产品名为「澄光维稳精华」。整体风格干净、轻奢、科学护肤感强。画面中心是一瓶半透明磨砂玻璃精华液,内部是淡金色液体,瓶身有细腻高光、水珠反射和轻微折射。背景为奶白到暖灰渐变,局部有流动液体、微观分子结构、柔和阴影装饰。整体既有品牌感,也有卖货感,看起来像真实天猫旗舰店或抖音商城主图。 海报必须包含以下文案: 澄光 维稳精华 修护屏障 舒缓泛红 细腻透亮 第 2 代升级配方 核心成分 神经酰胺 泛醇 B5 积雪草提取物 微囊脂质体 适合人群 敏感肌 熬夜肌 换季不稳定肌 限时到手价 229 元 买 1 送 3 赠洁面 15ml 赠精华 5ml 赠面霜 10g 左下角小字: 实际效果因人而异,请坚持使用 要求重点测试产品名、功能短句、价格、赠品列表、瓶身细节与中文层级排版。整体高级,不要直播间大字报风格。

03 真实生活摄影

生成一张极其真实的商场纪实摄影照片。场景是周末傍晚的大型购物中心扶梯口,一位 28 至 32 岁的亚洲男性刚从上行扶梯走下来,左手拎着购物袋,右手低头回消息,没有看镜头,神态自然。他穿深灰色连帽卫衣,外搭黑色轻薄夹克,下身是宽松卡其裤和轻微磨损的运动鞋,头发略乱,脸上有一点出油感和轻微胡茬。商场灯光复杂,顶部暖白灯、橱窗冷白灯、远处广告屏彩色光混合,地面是高反光瓷砖,有模糊但真实的倒影。背景包含经过的人群、奶茶店招牌、玻璃护栏、模糊品牌海报。要求像摄影师在商场里抓拍到的一张真实瞬间,不能像时尚街拍摆拍,皮肤、衣服褶皱、鞋面磨损、购物袋折痕、玻璃反射都要非常真实。

04 高密度信息图

根据以下信息创建一张可爱的繁复主义风格信息图(人物形象使用参考图里的人物):各位开发者朋友,大家好!今天,我们很高兴宣布开源Qwen3.6-35B-A3B! 新模型拥有 卓越的Agentic Coding能力 强大的多模态感知与推理能力 并以Apache2.0协议开源 现在,你可以在QwenStudio中与新模型对话交互,或从HuggingFace和ModelScope 下载模型进行本地部署。阿里云百炼也即将上线名为Qwen3.6-flash的API服务。 快来体验我们最新开源的Agentic Coding"小钢炮"吧! 链接:
Blog: https://qwen.ai/blog?id=qwen3.6-35b-a3b
Qwen Studio: https://chat.qwen.ai
HuggingFace: https://huggingface.co/Qwen/Qwen3.6-35B-A3B
ModelScope: https://modelscope.cn/models/Qwen/Qwen3.6-35B-A3B

05 一致性

生成一张 3x3 九宫格真人角色表情图。主体是同一位 23 岁左右的亚洲女生,黑色锁骨发,白色衬衫,浅灰针织开衫,五官自然清秀,不要网红脸。九个格子中人物必须保持同一张脸、同一发型、同一服装,只改变表情和轻微动作。九个格子分别为: 微笑 惊讶 皱眉 大笑 生气 无语 认真思考 委屈 比心 要求人物一致性强,不能每格都像不同的人;同时表情要有足够区分度。整体像真实社交贴图素材。

06 参考图二创

请基于我上传的这张宠物照片进行二次创作,必须严格保持这只猫的花色、脸型、体态特征与整体神态一致,不要改成另一只猫。 以「这只猫 X 肯德基联名企划」为主题,生成一张中文商业联名海报。让小猫穿肯德基员工制服、戴员工帽、佩戴工牌,站在柜台前与炸鸡桶、薯条、汉堡、可乐互动。整体红白配色,有明显肯德基品牌联名感,但画面要真实可爱、有商业海报质感,不要过度卡通化。 海报中自由添加合理中文文案,但要包含: 联名限定 新品上线 限时主题门店 要求重点测试:主体一致性、品牌元素融合、商业排版、参考图改造能力与细节稳定性。