👀 最新、最有用的AI编程姿势,总来自「知识药丸」
《贾杰的AI编程秘籍》付费合集,共10篇,现已完结。30元交个朋友,学不到真东西找我退钱;)
以及我的墨问合集《100个思维碎片》,1块钱100篇,现已完结。(文末有订阅方式
质量更顶的《又100个思维碎片》不定期更新中,与你探讨AI编程2.0等有意思的话题(文末有订阅方式
就在刚刚,Google 发布了 Nano Banana 2,评论区炸了。
我其实一直搞不太清楚 Google 在图像这块的布局——Imagen、Nano Banana、Nano Banana Pro……感觉名字一个比一个奇怪,关系也乱。趁这次机会,我把来龙去脉理了一遍,写下来备忘。
Nano Banana 系列:一条"速度 vs 质量"的产品线
要搞懂 Nano Banana 2 是什么,得先搞清楚 Google 图像模型这一年的演变脉络。
2025 年 8 月,Google 悄悄在 LMArena 平台上放了一个匿名模型,代号"Nano Banana",底层是 Gemini 2.5 Flash Image。当时社区就发现它很能打,各种修图、生图效果出人意料。
2025 年 11 月,Nano Banana Pro 登场,底层换成了 Gemini 3 Pro Image——这是旗舰级的推理模型。Pro 版本的核心能力是"先思考,再画图",会生成一些中间态的"思维图"来推敲构图,再输出最终结果。你要做一张复杂的信息图,或者让图里的文字既清晰又有设计感,Pro 是不二之选。
2026 年 2 月 26 日,就是今天,Nano Banana 2 来了。
你可能会困惑:已经有 Pro 了,为什么还要出 2?
这其实是 Google 一贯的双轨策略:Flash = 速度优先,Pro = 质量优先。
Nano Banana 2 的技术名称是 Gemini 3.1 Flash Image,它的定位不是"超越 Pro",而是把 Pro 的大部分能力,塞进 Flash 的速度里。HubX 的测试数据是延迟降低了 74-76%,相当于快了将近 4 倍,同时质量还维持在接近 Pro 的水准。
这就像汽车界里的"性能钢炮"——不是最贵的,但性价比把旗舰车型打得找不到北。
四个值得关注的新能力
联网生图:它知道世界长什么样
这是我觉得最有意思的一点。
Nano Banana 2 能通过实时网络搜索来辅助图像生成。你想生成一张"东京涩谷的夜晚",它不只靠训练数据里的印象,而是会去搜一搜当下涩谷的真实图像,作为参考来生图。
官方做了一个叫 "Window Seat" 的演示 App,输入一个地名,它会结合实时天气和真实图片,生成一张那个城市窗外的风景照。细节真实程度高得有点出乎意料。
这个能力的本质是把世界知识"接地"了——生成的内容不再是模型记忆里的模糊印象,而是有真实参照的具体事物。
图中文字:终于不再是鬼画符
图像 AI 的文字渲染问题,搞过图像生成的同学都懂,一度是致命伤——生成的图里文字要么变形,要么像乱码,基本不可用。
Nano Banana 2 在这块做了专项提升,支持多语言文字渲染,而且还能在图里直接完成本地化翻译(in-image localization)。官方的 "Global Ad Localizer" Demo 展示了把一张广告图翻译成多种语言版本,文字和视觉内容同步适配不同市场。
对做内容本地化的团队来说,这个能力的价值不用多说。
更精细的创意控制
新增了几个之前没有的参数,主要包括:
原生支持 4:1、1:4、8:1、1:8 这些极端比例(之前没有),以及新增了 512px 分辨率档位,用于快速迭代时减少延迟。
更重要的是新增了 "thinking level"(推理强度)控制——你可以选 Minimal 或 High/Dynamic。简单来说:普通任务用 Minimal,省时间;复杂 Prompt 用 High,让模型多想一会再画,质量更好。
这个设计挺聪明的,把"速度 vs 质量"的选择权交给了开发者,而不是做一个固定的权衡。
跑分战绩
社区整理的数据(来自 Artificial Analysis Image Arena 和 LM Arena)显示:在文生图排行榜,Nano Banana 2 登上了第一名,而且价格只有 Nano Banana Pro 的一半左右。图像编辑方面,它和 ChatGPT-Image-Latest 并列第一(单图编辑赛道)。
当然,跑分这种事情参考一下就好,实际场景里不同任务差距会很不一样。Reddit 上也有人说某些编辑任务感觉不如预期,所以用之前自己测一测才是正经的。
定价与接入方式
价格(API)大致如下:
**512px(新增)**对应是更低的起步档,1K 图约 ,图约0.101,4K 图约 $0.151。
跟 Nano Banana Pro 相比,大约是便宜 30-50%,但速度快了接近 4 倍。对高并发、对延迟敏感的应用场景,这个性价比基本没有对手。
接入途径:Gemini API(gemini-3.1-flash-image-preview)、Google AI Studio(需要付费 API Key)、Vertex AI、Firebase 和 Google Antigravity 都支持。普通用户侧,Gemini App 的 Fast/Thinking/Pro 三个模式已经把默认图像模型换成了 Nano Banana 2;如果是 Google AI Pro 或 Ultra 订阅用户,还可以通过三点菜单切回 Pro 版本。
但也有需要注意的坑
Reddit 上有几条评论我觉得值得记录一下,算是"社区踩坑记录":
有用户反馈,第一次尝试的结果里出现了文字幻觉(hallucinated text)——明明让它生成特定文字,结果文字是错的。这种问题在 Flash 系列里一直时有发生,使用时要做好 fallback 机制。
还有人提到,PNG 透明背景目前还不支持。这在某些工作流里是硬伤,需要绕路处理(比如后期用其他工具扣图)。
另外,用 Flash 系列的模型做多图尺寸混合时,图像尺寸不总是被严格遵守。如果你的 pipeline 对输出尺寸有强约束,需要额外做校验。
总结
一句话概括:Nano Banana 2 是 Google 把旗舰图像能力"下放"到 Flash 速度档的一次成功尝试。
对开发者来说,选型逻辑现在很清晰:
快速原型、高并发、成本敏感 → Nano Banana 2(Gemini 3.1 Flash Image)
复杂创意、专业出图、质量优先 → Nano Banana Pro(Gemini 3 Pro Image)
如果你在做图像生成相关的产品,值得把 Nano Banana 2 加进测试清单里,特别是联网生图和文字渲染这两块,进步相当明显。
参考资料
- • 官方博客(开发者向):Build with Nano Banana 2
- • Gemini API 文档:Image Generation
- • 官方发布页:Nano Banana 2 Overview
- • 社区讨论:Reddit r/singularity
坚持创作不易,求个一键三连,谢谢你~❤️
以及「AI Coding技术交流群」,联系 ayqywx 我拉你进群,共同交流学习~