OpenAI新图像模型意外曝光,文字渲染强得惊人

0 阅读3分钟

OpenAI新图像模型意外曝光,文字渲染强得惊人

viva-de722851-dacd-406c-89df-86c2daecb4db.png 2026年4月4日,OpenAI的新一代图像生成模型GPT-Image-2在Chatbot Arena上意外曝光,引发科技圈热议。

意外泄露还是官方测试?

独立开发者levelsio首先发现,GPT-Image-2以三个代号悄然上线Chatbot Arena:maskingtape-alpha、gaffertape-alpha、packingtape-alpha。 这些测试目前已经下线,但已经流出了部分生成样本。 从泄露的信息来看,OpenAI并没有正式发布这个模型,而是在Chatbot Arena上进行灰度测试,结果被眼尖的开发者发现了。

viva-7658317a-d277-40ee-8e7a-e0127981e904.png

GPT-Image-2强在哪?

根据流出的Demo,GPT-Image-2在两个核心能力上有了显著提升: 1. 文字渲染能力大幅增强 之前的AI图像模型,文字渲染一直是个痛点——生成的图片里文字经常错位、模糊、甚至乱码。 GPT-Image-2的文字渲染能力强得惊人,几乎可以媲美专业的设计软件。这意味着:

  • 做海报可以直接在图里加文字,不用再Photoshop后期
  • 做UI设计图可以直接标注文字
  • 做营销素材可以一键生成带文案的图片 2. 世界知识理解更深 模型对现实世界的理解更强了。比如你让它画"一个日本高中生在便利店买零食",它能准确呈现日本高中生的校服样式、便利店的SKU陈列等细节。

为什么要用代号测试?

OpenAI一贯喜欢用代号进行早期测试。GPT-4发布前也用过类似方式。 用maskingtape(胶带)、gaffertape(胶带)、packingtape(打包胶带)这些名字,可能是:

  • 内部代号习惯
  • 混淆视听,避免过早暴露
  • 临时测试用的随机名

viva-5baee363-c764-4e42-9c9e-baae932e1e2b.png

对行业有什么影响?

如果GPT-Image-2正式发布并开放API: 1. 设计师压力变大 文字渲染能力这么强,很多简单设计工作可以直接用AI完成,不需要设计师了。 2. 营销公司成本下降 做一张海报的成本从几百块降到几分钱,AI生成-微调-出稿的流程会更高效。 3. 其他厂商加速追赶 Google、Midjourney、Stability AI肯定会加快更新速度,新一轮图像生成大战要来了。

怎么第一时间用上?

官方还没正式发布,但根据之前的信息:

  • GPT-Image-2预计很快开放API
  • 可能会在GPT-5的配套功能中推出 想第一时间体验,可以关注OpenAI官方博客,或者用聚合平台(如ViVaAPI)等待接口开放。 目前想用AI生图,可以先用现有的gemini-3-pro-image-preview API,同样支持文字渲染和高质量图像生成。

总结

GPT-Image-2的意外曝光,说明OpenAI的图像能力还在持续进化。 从DALL-E 2到DALL-E 3再到GPT-Image-2,文字渲染这个痛点正在被解决。未来设计师和创作者的门槛会越来越低——会用提示词,就能做出专业级别的设计。 当然,AI不会完全取代设计师,而是会取代不会用AI的设计师

📌 友情提示:给大家推荐一个稳定运营多年的AI聚合API站点,可搜索ViVaAPI,一个API Key接入 600 + 主流 AI 模型,便宜又稳定。