期待已久的 Nano Banana 终于揭开了它神秘的面纱,正式发布了!
它有个正式的名字叫做:Gemini-25-flash-image,之前很多人的猜想得到了验证,这个强大的图像生成模型来自于 Google。
不出所料,它立马跻身图片编辑模型第一:
上周阿里发布的 Qwen-Image-Edit 已经让人震惊,它很好的解决了图像一致性以及文字的问题,仅仅一周又被 Google 颠覆了,不仅如此,它势必开启一个新的时代。
且听我慢慢道来。
Gemini-25-flash-image最为人称道的强大之处就在于:保持图像的一致性。也就是说,通过这个模型编辑之后的图片仍然和原图片形象保持一致,比如你只是换个发型、换件衣服、戴个墨镜甚至换个角度、换个场景,不管怎么换,你还是你,不会变成一个其他人。
这就是当前最强的ai绘画模型 nano banana,昨天已经正式上线,所有人可用。
点赞收藏好,今天手把手教你在人物、电商等等日常情景下如何使用这个模型,玩法多样,各位看好。
1、人物
这个模型最让我惊讶的是它的人物一致性。虽然现在大部分ai绘画产品都支持图生图的功能,但如果你上传的照片不是ai认识的名人,还是很难保证完美一致性。比如我这张照片
让这个男人长胖20斤
只需要输入提示词,就能做到这个效果
提示词:Give this man a different hairstyle.
但同样,其他模型……
给大家看看
对比之下,效果一目了然。
又或者我想网购一套衣服,不知道穿身上效果如何。只需要上传这套ootd,就自动出来了效果。哪怕原图只是半身照,ai也能自动帮你完善。
提示词:Make this man wear the clothes from the picture.
不光单人照片,P图对象换成多人也能很好的完成。给大家看看国外的网友都是怎么玩。上传一张原图
给一对好基友自动换衣服和场景。
又或者,几个小姐妹聚会的照片。输入提示词,让大家都端起酒杯,甚至可以跟明星合影。
此外,上传人物的照片,再上传一个姿势草图,它就能画出指定动作的图。不需要lora,没有复杂的工作流,效果特别好。
2、电商
这个模型对于做电商的人来说简直是王炸。比如这个女人手里拿着一本书,再随便上传个图,女人手里的书就变成这本。
这个模特,再上传一个眼镜的图,就得到了一个戴眼镜的模特。仔细看商品的细节,是不是跟原图一致!连上面的花纹都一样。
更离谱的是它能理解原模特图的风格,给你完美融合。比如这种油画风的模特照,上传一个产品图,这个展示照也变成了对应风格。
再比如这种黑白的艺术照,上传一个产品图,你看看是不是一点都不违和
电商还有个离谱的玩法,比如随便画个草图,然后上传一张商品图进去,输入提示词,就自动给你生成模特抱着产品的照片。
并且改变现有的物品也可以,这是一张纯白的床,这是一个三叶草logo。合体!自动生成了三叶草床单
包括前段时间爆火的《黑神话钟馗》,上传一张图,就能生成钟馗手办图
3、连续镜头
既然banana不管人物和物品的一致性都能保持这么好,那么完全可以用来生成一些连续镜头去做内容。比如上传一张动漫熊的图,然后自动生成连续漫画。
我随手拍一张这个海贼王的手办照片,自动给我做成四格漫画。
提示词:Generate a four-panel comic based on this snail.
不光漫画,电影风也可以。只需要上传一张基础的底图
就可以改变图像角度、氛围、表情,甚至重构场景。创作者可以像导演一样,快速精准地控制每一个细节。这种精确控制, 是其他所有AI都做不到的。
添加图片注释,不超过 140 字(可选)
不管是画风还是一致性,都保持的完美。如果再配上ai视频的首尾帧,可以很轻松做一部ai影片出来。
添加图片注释,不超过 140 字(可选)
4、文字编辑
最后,是文字编辑。这是小米旗舰店的商品图,输入提示词“把1869改成1250”。马上,图片价格就变了,效果非常稳定。
再比如这个人运动的照片,让它加个字,一张高级感的海报就出来了
但在我实测的时候发现,目前文字只对英文和数字表现比较好,中文的效果稍微差了点。比如这张,字写的还是有点瑕疵,期待后续更新。
当然,这个模型也不是完美的,在文字方面就很拉跨,比如我想给照片右侧加上小的竖体文字:摄影 1901 年 8 月 10 日,会得到:
汉字完全是乱的,这方面 Qwen 仍然是王者。
总体来说,Gemini-25-flash-image非常强大,它强大的一致性功能不仅彻底解锁了 AI图像合成,而且势必打开 AI 视频的全新局面。
还等什么,赶紧去试试。
5、免费使用的方案
最后,千言万语都不如你实际上手体验,给大家分享几种免费使用的方法!
1、AI studio
在Google AI studio中,右上角模型确认用的是Gemini 2.5 Flash lmage Preview模型,然后在输入框中直接写提示词,加上图片,就能开始使用banana。
使用地址:aistudio.google.com/app/prompts…
2、Gemini
在Gemini里面直接切换为2.5flash,然后勾选图片模式,然后上传图片,输入提示词,就可直接使用。里面默认调用的Gemini-25-flash-image模型。
使用地址:gemini.google.com/
3、AI opal
Google新推出的工作流产品opal中,输入这段提示词:
用nano banana模型,做一个AI绘画程序,能上传图片,输入提示词,定义纵横比,最后生成图片
Opal会直接给我们一个接入了banana模型的小程序。这个方法不仅能用banana,还能免费使用veo3。
4、模型竞技场
打开竞技场的官网,选择side by side,不用抽奖,直接选择Gemini 2.0 Flash lmage Preview Generation,也就是banana。
另一边选择别的模型,可以看到同一个提示词,在不同模型中的表现效果。
使用地址:h5ma.cn/lpi
5、Whisk
Whisk 隶属于谷歌实验室,这是谷歌测试其 AI 项目的试验场,包括 Gemini、Imagen 以及最新的视频模型 Veo2等。
用户可以直接上传图片至 Whisk,或者在该工具内生成图片,指定主题、场景和风格等元素。Whisk 系统支持用户混合和匹配这些组件,并可根据需要使用附加的文本提示进行微调。
6、谷歌Flow
谷歌视频制作官方平台
选图生视频,生成新图即可使用就能调用Gemini-25-flash-image模型给你使用。
总体来说,Gemini-25-flash-image非常强大,它强大的一致性功能不仅彻底解锁了 AI图像合成,而且势必打开 AI 视频的全新局面。