GPT Image 2:AI生图的「iPhone时刻」来了
| OpenAI 还没正式发布的 GPT Image 2 已经在全网引起轰动,是真的实现已经以假乱真了! |
|---|
4月初,三个匿名模型悄悄出现在 LM Arena(AI模型盲测竞技场)上:
maskingtape-alpha
gaffertape-alpha
packingtape-alpha
但有些测试的人很快就发现,这三个模型生成的图像质量比目前所有其他模型都要好得多。
几天后,模型被紧急撤下,可这已经晚了,截图和测试结果早就传遍了网络。
| 为什么叫「胶带」系列? 三个代号都和胶带相关(封箱带、美纹纸、遮蔽胶带),估计是内部代号 "duct-tape" 的变体。OpenAI 还是那么有梗。 |
|---|
后面越来越多 ChatGPT Plus/Pro 用户发现自己被纳入了新版图像模型——GPT Image 2 的灰度测试,实际上这个模型已经在小范围进行测试了。
X(原 Twitter)上 @levelsio 的一条推文收到了 107 条回复:
"OpenAI's new image model GPT-Image-2 has leaked. It seems to have extremely good world knowledge and great text rendering. Possibly better than Nano Banana Pro."
@arrakis_ai 的评价更加直接:
"Holy shxt… The rules of AI image generation just completely changed."
这是全网讨论最集中的一个点。
之前,像 DALL·E、Midjourney 和 GPT Image 1.5 这些,生成图片里的文字几乎都没法看,字母歪歪扭扭,中文全是乱码。但 GPT Image 2 把这个问题彻底解决了:
中、日、英多种语言基本不会出错
文字能很自然地融入图片场景,不会漂浮也不变形
小字号、密集的文字也能稳定输出
实际测试,文字渲染准确率在 99%以上
有人用特别简单的提示词测试中文场景,生成了校园日报、潮菜馆菜单、人教版小学三年级语文课本页面、2026 年老黄历,每张图片里的中文都准确无误。
| 也有人说: "GPT镜像2可能已经上线了。在这个层级,面对如此密集的中文,输出依然如此稳定。图2是抖音的界面,之前可能很难如此精确地模拟出来。" |
|---|
这是测试者的第一反应。
GPT Image 2 生成的图片在下面这些方面达到了前所未有的好水平:
手部细节很准确(AI 生成图片时手部容易出错的问题终于解决了)
光影反射很自然,镜面、水面、玻璃表面的折射效果都没问题
物理关系很合理,物体之间的遮挡、叠放情况和阴影都很一致
包含的知识很丰富——书架上的书数量、摆放方式和书名都正确;超市传单上的价格标签很清晰
| 有人用 GPT Image 2 生成了一张身份证图片,图片上身份证号的前几位数字符合地区编码规则,老逼真了,虽然最后一位校验位是错的,但这也太危险了吧... |
|---|
角色、构图和色调能保持高度一致
多张图片风格连贯,适合系列海报、书籍封面和品牌视觉设计
支持精确的局部编辑(灰度版图像有编辑按钮)
GPT Image 2还有一个厉害点:能生成和真实软件界面看起来一模一样的图片。
浏览器窗口、移动端App界面、数据仪表盘
YouTube播放器界面、Windows系统界面
抖音界面——有密密麻麻的中文和复杂的UI布局,之前没有模型能达到这种精度
这对设计师和产品经理来说:一句话就能生成高保真的UI原型图。
以前用GPT生成图片,最被大家吐槽的问题之一就是所有图片都像加了一层“暖黄滤镜”。
GPT Image 2 把这个问题彻底解决了,图片色彩变得更加中性、自然。
三、GPT Image 2 vs Google Nano Banana Pro:谁更强?
这是目前AI圈争论最激烈的话题之一。
Nano Banana Pro 是 Google Gemini 的图像模型,此前被认为是最强的AI图像生成器。
| 对比维度 | GPT Image 2 | Nano Banana Pro |
|---|---|---|
| 文字渲染 | 🏆 公认最强,多语言零错误 | 优秀但偶有错误 |
| 真实感 | 🏆 照片级,手部/光影极准 | 很好,但对比下稍逊 |
| 中文支持 | 支持但复杂场景不稳 | |
| UI截图 | 🏆 以假乱真级别 | 有一定能力 |
| 色彩 | 中性自然,无滤镜 | 色彩表现均衡 |
| 空间推理 | 镜面反射偶有错误 | 表现类似 |
社区的共识很明确:在文字渲染和复杂中文场景上,GPT Image 2 已经全面超越 Nano Banana Pro。
有人的评价一针见血:
"看多了 Nano Banana 那种图之后,用 GPT Image 2 生成的信息图,真的是眼前一亮。"
🗼X(Twitter)热议
独立开发者大V @levelsio 最先透露了泄露消息,这条推文有107条回复。
@arrakis_ai 发帖子称“AI图像生成的规则完全改变了”,这条帖子有71条回复。
@mark_k 报告说,越来越多的人进入了新模型的灰度测试,还表示“看起来很可能下周发布”。
🕐Reddit r/OpenAI
有帖子直接对 GPT Image 2 和 Nano Banana Pro 做了盲测对比。
点赞很多的评论说:“这不是从网上下载的照片吧?这是每个测试者的第一反应。”
有人说“很多人可能要卷铺盖走人了”,这里指的是设计师和素材制作岗位的人。
🧀剑桥大学学生 AcerFur 的冷静分析
在大家都很狂热的时候,也有人很理性。AcerFur 发现:
镜面反射中文字的方向还是不对。
解剖图外观看着挺专业,但细节有错误。
空间推理能力还不完善。
这说明 GPT Image 2 虽然很厉害,但也有缺点。
🎡知乎
热帖标题直接写《GPT - 5.5、GPT - 6 和 GPT - Image 2.0 这次“泄露”,OpenAI 真能扭转局面吗?》——国内关注的竞争和产业会受到什么影响。
🎈B站
已经有好几个体验教程视频了,都说“文字错乱已解决”
🌀V2EX
技术社区的帖子也总结了三个主要优点:文字渲染效果最好、多语言不出错、还能商业。
微信群/社区圈子的人都说:
“太震撼了……你能看出这是 AI 生成的图吗?今天群里的朋友们都在玩一个新的生图模型,根本看不出是 AI 生成的。”
“今天 GPT - Image - 2 突然上线了。这张图,如果不是群里朋友指出来,你根本看不出是生成的。Nano Banana Pro 又有压力了,该降价了吧?”
“OpenAI 的 gpt - image - 2 悄悄搞了个厉害的功能:中文图片生成没有错字。别小瞧这个——中文文字渲染一直是 AI 图像生成的大难题。要是这次真做到了,中文设计素材市场可能会重新洗牌。”
OpenAI 还没有正式公布发布日期。不过从下面这些线索能推测:
GPT Image 1 预计在 2025 年 3 月
GPT Image 1.5 预计在 2025 年 12 月(和 GPT Image 1 间隔 9 个月)
Sora 关停 预计在 2026 年 3 月(关停后会释放大量算力)
LM Arena 泄露 预计在 2026 年 4 月初
灰度测试扩大 预计在 2026 年 4 月中旬(就是现在)
大家普遍认为:很可能会在 2026 年 4 - 6 月正式发布。
LM Arena(arena.ai):可以进行匿名盲测,有机会被选中体验
ChatGPT Plus/Pro:目前正在灰度测试,运气好的话会自动切换到新模型
等正式发布:估计很快就会正式发布
文字准确、风格一致,还能编辑,这下终于能直接用在商业交付里了。
像电商海报、社交媒体配图、课程封面、品牌视觉这些东西,制作成本会大大降低。
身份证、银行界面、新闻截图……要是AI生成的图片和真的图片没法分辨,那验证信息的难度会成倍增加。
这不是未来才有的问题,现在就已经存在了。
GPT Image 2 不会替代设计师,但会取代那些“只懂执行、不会思考”的设计工作。
未来的设计师需要具备“审美判断力+运用AI工具的能力”,也就是知道自己想要什么、怎么让AI做出来、怎么判断效果好不好。
| 一句话总结:GPT Image 2 可不是普通的升级。它让 AI 生成的图片从“看着有点像那么回事”变成了“根本看不出是 AI 生成的”。一旦跨过这个坎,整个内容创作行业的规则都会被改变。 |
|---|