Nano Banana 2 来了，更便宜更快的大香蕉跟 Nano Banana Pro 相比，大约是便宜 30-50%，

cover

👀 最新、最有用的AI编程姿势，总来自「知识药丸」

《贾杰的AI编程秘籍》付费合集，共10篇，现已完结。30元交个朋友，学不到真东西找我退钱；）

以及我的墨问合集《100个思维碎片》，1块钱100篇，现已完结。（文末有订阅方式

质量更顶的《又100个思维碎片》不定期更新中，与你探讨AI编程2.0等有意思的话题（文末有订阅方式

就在刚刚，Google 发布了 Nano Banana 2，评论区炸了。

我其实一直搞不太清楚 Google 在图像这块的布局——Imagen、Nano Banana、Nano Banana Pro……感觉名字一个比一个奇怪，关系也乱。趁这次机会，我把来龙去脉理了一遍，写下来备忘。

Nano Banana 系列：一条"速度 vs 质量"的产品线

要搞懂 Nano Banana 2 是什么，得先搞清楚 Google 图像模型这一年的演变脉络。

2025 年 8 月，Google 悄悄在 LMArena 平台上放了一个匿名模型，代号"Nano Banana"，底层是 Gemini 2.5 Flash Image。当时社区就发现它很能打，各种修图、生图效果出人意料。

2025 年 11 月，Nano Banana Pro 登场，底层换成了 Gemini 3 Pro Image——这是旗舰级的推理模型。Pro 版本的核心能力是"先思考，再画图"，会生成一些中间态的"思维图"来推敲构图，再输出最终结果。你要做一张复杂的信息图，或者让图里的文字既清晰又有设计感，Pro 是不二之选。

2026 年 2 月 26 日，就是今天，Nano Banana 2 来了。

你可能会困惑：已经有 Pro 了，为什么还要出 2？

这其实是 Google 一贯的双轨策略：Flash = 速度优先，Pro = 质量优先。

Nano Banana 2 的技术名称是 Gemini 3.1 Flash Image，它的定位不是"超越 Pro"，而是把 Pro 的大部分能力，塞进 Flash 的速度里。HubX 的测试数据是延迟降低了 74-76%，相当于快了将近 4 倍，同时质量还维持在接近 Pro 的水准。

这就像汽车界里的"性能钢炮"——不是最贵的，但性价比把旗舰车型打得找不到北。

四个值得关注的新能力

联网生图：它知道世界长什么样

这是我觉得最有意思的一点。

Nano Banana 2 能通过实时网络搜索来辅助图像生成。你想生成一张"东京涩谷的夜晚"，它不只靠训练数据里的印象，而是会去搜一搜当下涩谷的真实图像，作为参考来生图。

官方做了一个叫 "Window Seat" 的演示 App，输入一个地名，它会结合实时天气和真实图片，生成一张那个城市窗外的风景照。细节真实程度高得有点出乎意料。

这个能力的本质是把世界知识"接地"了——生成的内容不再是模型记忆里的模糊印象，而是有真实参照的具体事物。

图中文字：终于不再是鬼画符

图像 AI 的文字渲染问题，搞过图像生成的同学都懂，一度是致命伤——生成的图里文字要么变形，要么像乱码，基本不可用。

Nano Banana 2 在这块做了专项提升，支持多语言文字渲染，而且还能在图里直接完成本地化翻译（in-image localization）。官方的 "Global Ad Localizer" Demo 展示了把一张广告图翻译成多种语言版本，文字和视觉内容同步适配不同市场。

对做内容本地化的团队来说，这个能力的价值不用多说。

更精细的创意控制

新增了几个之前没有的参数，主要包括：

原生支持 4:1、1:4、8:1、1:8 这些极端比例（之前没有），以及新增了 512px 分辨率档位，用于快速迭代时减少延迟。

更重要的是新增了 "thinking level"（推理强度）控制——你可以选 Minimal 或 High/Dynamic。简单来说：普通任务用 Minimal，省时间；复杂 Prompt 用 High，让模型多想一会再画，质量更好。

这个设计挺聪明的，把"速度 vs 质量"的选择权交给了开发者，而不是做一个固定的权衡。

跑分战绩

社区整理的数据（来自 Artificial Analysis Image Arena 和 LM Arena）显示：在文生图排行榜，Nano Banana 2 登上了第一名，而且价格只有 Nano Banana Pro 的一半左右。图像编辑方面，它和 ChatGPT-Image-Latest 并列第一（单图编辑赛道）。

当然，跑分这种事情参考一下就好，实际场景里不同任务差距会很不一样。Reddit 上也有人说某些编辑任务感觉不如预期，所以用之前自己测一测才是正经的。

定价与接入方式

价格（API）大致如下：

**512px（新增）**对应是更低的起步档，1K 图约，图约0.101，4K 图约 $0.151。

跟 Nano Banana Pro 相比，大约是便宜 30-50%，但速度快了接近 4 倍。对高并发、对延迟敏感的应用场景，这个性价比基本没有对手。

接入途径：Gemini API（gemini-3.1-flash-image-preview）、Google AI Studio（需要付费 API Key）、Vertex AI、Firebase 和 Google Antigravity 都支持。普通用户侧，Gemini App 的 Fast/Thinking/Pro 三个模式已经把默认图像模型换成了 Nano Banana 2；如果是 Google AI Pro 或 Ultra 订阅用户，还可以通过三点菜单切回 Pro 版本。

但也有需要注意的坑

Reddit 上有几条评论我觉得值得记录一下，算是"社区踩坑记录"：

有用户反馈，第一次尝试的结果里出现了文字幻觉（hallucinated text）——明明让它生成特定文字，结果文字是错的。这种问题在 Flash 系列里一直时有发生，使用时要做好 fallback 机制。

还有人提到，PNG 透明背景目前还不支持。这在某些工作流里是硬伤，需要绕路处理（比如后期用其他工具扣图）。

另外，用 Flash 系列的模型做多图尺寸混合时，图像尺寸不总是被严格遵守。如果你的 pipeline 对输出尺寸有强约束，需要额外做校验。

总结

一句话概括：Nano Banana 2 是 Google 把旗舰图像能力"下放"到 Flash 速度档的一次成功尝试。

对开发者来说，选型逻辑现在很清晰：

快速原型、高并发、成本敏感 → Nano Banana 2（Gemini 3.1 Flash Image）

复杂创意、专业出图、质量优先 → Nano Banana Pro（Gemini 3 Pro Image）

如果你在做图像生成相关的产品，值得把 Nano Banana 2 加进测试清单里，特别是联网生图和文字渲染这两块，进步相当明显。

参考资料

• 官方博客（开发者向）：Build with Nano Banana 2
• Gemini API 文档：Image Generation
• 官方发布页：Nano Banana 2 Overview
• 社区讨论：Reddit r/singularity

坚持创作不易，求个一键三连，谢谢你～❤️

以及「AI Coding技术交流群」，联系 ayqywx 我拉你进群，共同交流学习～

订阅链接 note.mowen.cn/detail/OLPE…