谷歌Nano Banana 2实测:登顶全球第一,中文能力却不行了!

89 阅读4分钟

谷歌Nano Banana 2深夜上线,我有点懵

就在昨晚,谷歌悄悄把Nano Banana 2给推上线了。

消息一出,生图圈直接炸锅,各大测评博主连夜开干,全网刷屏。

图片

但我实话实说,看完这次更新的内容,我一度怀疑谷歌是不是把版本号写反了,Pro和2,到底谁才是Pro?

先说官方给出的数据。

Artificial Analysis的文生图基准测试里,Nano Banana 2拿下了全球第一。

图片

图像编辑能力排第三,仅次于GPT Image 1.5和Nano Banana Pro,Image Arena中,NB2同样问鼎榜首,拿了1279 Elo的分数。

图片

谷歌CEO皮查伊亲自下场发帖:「这是我们迄今为止最好的图像模型。」

图片

但你细看这次更新,真正的大变化只有两个:更快、更便宜。

底层上,Nano Banana 2背靠全新的Gemini 3.1 Flash Image,相当于从Pro那儿蒸馏出来了一个轻量版本。

能力的受损度控制得还不错,但也不是毫发无损,这个后面实测部分再细说。

这一代还有个新能力值得单独提:实时联网

以前的生图模型,画的东西全凭训练数据里"记住"的样子。现在Nano Banana 2接入了Gemini的知识库和实时网络搜索,相当于画画之前先去查了一遍资料。

比如让它生成广州天气的卡片。

图片

谷歌还搞了一个叫「Window Seat」的演示,让模型根据你指定的任意地点,结合实时天气数据,生成那个窗口视角的画面,分辨率还支持2K/4K。

图片

规格这边也有一些实在的升级。分辨率覆盖512px到4K,512px是这次新加的低延迟档位,专门为高频批量生成优化;

宽高比新增了4:1、1:4、8:1、1:8这些极端比例,究极长条卷轴图终于可以原生出了,不用再靠后期裁切。

图片

主体一致性方面,单一工作流最多支持5个角色、14个对象保持一致,做分镜和连续叙事的创作者应该会感兴趣。

价格方面,1K图从Banana Pro的0.134美元降到了0.067美元,砍了将近一半;4K图从0.24美元降到0.151美元,降幅约40%。

输入Token价格从2美元/百万Token大跳水到0.25美元/百万Token。

目前模型已经在Gemini App、Google Search、Google AI Studio、Vertex AI等平台上线。

想要尝鲜的可以去Gemini官网去使用,免费额度大概每天是20张。

基本情况就是这样。

基于Nano Banan 2,我自己也跑了10张图,大家可以看一下效果。

首先就是大家熟悉的物体解析,整体的完成度非常高,但图片中也多了一些无用的元素,比如最底下的地球仪。

图片

个人感觉,Nano Banana 2的中文渲染能力比Pro还退步了不少。文字多的情况下,乱码概率明显变高,很多汉字根本没法辨认。

图片

这块没毛病,皮肤细节、光影表现都在线。

不过说实话,现在主流的生图模型基本上也都能达到这个水平了,Nano Banana 2在这个维度上并没有拉开什么差距。

图片

说实话,换很多模型,这种复杂提示词大概率就是一团乱麻。但Nano Banana 2把这张图给稳住了。卷轴形态完整,城市地标辨识度高,体积光氤氲的氛围感也到位。

图片

产品主体清晰,水果鲜果的质感饱满,飞溅奶液的动态感也出来了。如果你是做电商或者品牌物料的,这个水平拿来出初稿完全够用。

图片四格的叙事逻辑完整,人物表情也够夸张够搞笑,黑白线条的手绘感也有。图片

好,重头戏来了。

我让Nano Banana 2查找苹果手机最新的五个型号,并制作一张中文信息对比图表。

结果它直接给我整出来了一台"苹果18"。

现在iPhone 18还没影呢,它就已经帮我把参数都编好了,还一本正经地列进了图表里。

这就暴露了一个很根本的问题:Nano Banana 2虽然支持实时联网,但并没有对信息来源做有效的筛选和核实。

图片

好了,此次测评就到这里,如果大家有更多的信息,欢迎分享!