别只会对焦裁剪了,用 Gemini 搞图片编辑/扩图/修图,这套 Prompt 才是效率关键

15 阅读4分钟

最近在处理一些运营图和产品素材时,发现很多人还在用传统修图软件的思路去使唤 AI,结果要么改得面目全非,要么根本没动对地方。其实现在的 Gemini(尤其是 2.5 Flash Image / Nano Banana 系列)在图像理解、局部重绘和上下文连贯上已经非常成熟,上传原图 + 自然语言指令,基本就能覆盖日常 80% 的“扩图、换背景、去杂物、风格迁移”需求。我平时要快速直连最新模型试水这些图像指令流,一般直接去 se.zzmax.cn 跑,不用折腾网络环境,先摸清楚合不合用再决定怎么搞。

核心逻辑:别只说“修好看”,要按“动作 + 范围 + 约束”下指令

Gemini 的图像编辑不是魔法,它更像一个“听得懂人话且有世界知识的设计助理”。翻车的常见原因是指令太模糊,比如“帮我修一下”“弄好看点”。更有效的是结构化描述:

  • 动作:去掉 / 替换 / 添加 / 变换风格 / 扩展画布
  • 范围:具体对象(如“背景里那个路人”“人物穿的外套”“图左的电线杆”)
  • 约束:保持什么不变(如“保持人物面部不变”“保留光影”“不要塑料感”)

例如:

❌ “把图修好看”

✅ “去掉背景里的路人和杂物;保持前景人物完全不变;将背景替换为‘黄昏下的城市天际线,窗户有暖光’;调整人物边缘光影,使其自然融合。”

扩图(Outpainting):给画面“续上”而不是硬拉伸

扩图最忌讳直接拖拽拉伸导致变形。Gemini 更适合的做法是:上传原图,指令它扩展画布并补全内容。

  • 指令示例:“将图片左右各扩展 30%,补全场景为‘同一条街道延续出去的街景,保持一致的建筑风格和光照方向’,确保原图内容完全不变。”
  • 关键点:最好补充“场景延续”的描述(比如“同一家咖啡馆的户外座位区向外延伸”),模型会利用世界知识去补全逻辑一致的细节,比纯像素填充自然得多。

修图与局部编辑:去杂物、老照片修复、材质/光影微调

这类需求最核心的是“精准命中范围 + 控制改动幅度”:

  • 去杂物/去路人

    “移除背景中所有的路人、垃圾桶和电线;不要改动建筑、天空和前景地面纹理。”

  • 老照片修复

    “修复这张老照片:去噪、增强清晰度、修复划痕,并变成自然彩色;保留面部特征和整体构图,不要过度平滑。”

  • 产品图精修

    “增强皮革纹理的微观细节,消除室内黄偏色;在产品下方加柔和倒影;保持形状、logo 和缝线清晰。”

换背景与“融合感”:只换底不算完,光影匹配才像真的

很多人换背景最大的破绽是“抠图感”——主体亮度和新背景对不上。Gemini 指令里建议显式要求融合:

  • “保持前景人物不变,将背景替换为‘拂晓薄雾中的日本竹林’;调整主体光源与色温,匹配森林中柔和的扩散光;加轻微烟雾感,让阴影看起来确实落在该空间里。”

    这种“背景故事 + 光影/色温/阴影”三位一体的描述,能大幅减少“贴上去”的违和感。

风格转换与创意编辑:从“滤镜”升级为“重打光重构图”

如果想做风格化,别只说“转油画”,尽量给视觉依据:

  • “用荷兰黄金时代绘画风格重新想象这张照片:戏剧性伦勃朗式灯光,强明暗对比;皮肤带写实油画纹理;背景用深沉温暖的棕黑调。”
  • “为舞者照片加入动感:手部与裙摆边缘做写实运动模糊;面部与身体核心保持清晰;背景加微焦外光流强化速度感。”

多轮编辑建议(很重要)

Gemini 支持多轮对话式编辑,别试图一次下 10 个要求。推荐顺序:

  1. 结构/清理:去杂物、换背景、裁切构图

  2. 氛围/光色:调色、光效、季节/天气转换

  3. 细节:皮肤纹理、材质锐化、局部对象替换

    每轮只改 1-2 件事,成功率更高,也更容易回溯。

总的来说,Gemini 做图片编辑/扩图/修图的核心价值,是把“PS 里半小时的选区+蒙版+调色”压缩成“上传+一句话”,但你得学会把需求说清楚:范围锁定、不变项声明、融合约束,这三点决定成品是不是“能发的图”。不想在账号、网络、环境上磨半天,想先直连最新模型试试这些图像指令合不合手的,去 se.zzmax.cn 试一试就行,传两张图就有数了。