别只会对焦裁剪了，用 Gemini 搞图片编辑/扩图/修图，这套 Prompt 才是效率关键随着Gemini多模态能力的

最近在处理一些运营图和产品素材时，发现很多人还在用传统修图软件的思路去使唤 AI，结果要么改得面目全非，要么根本没动对地方。其实现在的 Gemini（尤其是 2.5 Flash Image / Nano Banana 系列）在图像理解、局部重绘和上下文连贯上已经非常成熟，上传原图 + 自然语言指令，基本就能覆盖日常 80% 的“扩图、换背景、去杂物、风格迁移”需求。我平时要快速直连最新模型试水这些图像指令流，一般直接去 se.zzmax.cn 跑，不用折腾网络环境，先摸清楚合不合用再决定怎么搞。

核心逻辑：别只说“修好看”，要按“动作 + 范围 + 约束”下指令

Gemini 的图像编辑不是魔法，它更像一个“听得懂人话且有世界知识的设计助理”。翻车的常见原因是指令太模糊，比如“帮我修一下”“弄好看点”。更有效的是结构化描述：

动作：去掉 / 替换 / 添加 / 变换风格 / 扩展画布
范围：具体对象（如“背景里那个路人”“人物穿的外套”“图左的电线杆”）
约束：保持什么不变（如“保持人物面部不变”“保留光影”“不要塑料感”）

例如：

❌ “把图修好看”

✅ “去掉背景里的路人和杂物；保持前景人物完全不变；将背景替换为‘黄昏下的城市天际线，窗户有暖光’；调整人物边缘光影，使其自然融合。”

扩图（Outpainting）：给画面“续上”而不是硬拉伸

扩图最忌讳直接拖拽拉伸导致变形。Gemini 更适合的做法是：上传原图，指令它扩展画布并补全内容。

指令示例：“将图片左右各扩展 30%，补全场景为‘同一条街道延续出去的街景，保持一致的建筑风格和光照方向’，确保原图内容完全不变。”
关键点：最好补充“场景延续”的描述（比如“同一家咖啡馆的户外座位区向外延伸”），模型会利用世界知识去补全逻辑一致的细节，比纯像素填充自然得多。

修图与局部编辑：去杂物、老照片修复、材质/光影微调

这类需求最核心的是“精准命中范围 + 控制改动幅度”：

去杂物/去路人：

“移除背景中所有的路人、垃圾桶和电线；不要改动建筑、天空和前景地面纹理。”
老照片修复：

“修复这张老照片：去噪、增强清晰度、修复划痕，并变成自然彩色；保留面部特征和整体构图，不要过度平滑。”
产品图精修：

“增强皮革纹理的微观细节，消除室内黄偏色；在产品下方加柔和倒影；保持形状、logo 和缝线清晰。”

换背景与“融合感”：只换底不算完，光影匹配才像真的

很多人换背景最大的破绽是“抠图感”——主体亮度和新背景对不上。Gemini 指令里建议显式要求融合：

“保持前景人物不变，将背景替换为‘拂晓薄雾中的日本竹林’；调整主体光源与色温，匹配森林中柔和的扩散光；加轻微烟雾感，让阴影看起来确实落在该空间里。”

这种“背景故事 + 光影/色温/阴影”三位一体的描述，能大幅减少“贴上去”的违和感。

风格转换与创意编辑：从“滤镜”升级为“重打光重构图”

如果想做风格化，别只说“转油画”，尽量给视觉依据：

“用荷兰黄金时代绘画风格重新想象这张照片：戏剧性伦勃朗式灯光，强明暗对比；皮肤带写实油画纹理；背景用深沉温暖的棕黑调。”
“为舞者照片加入动感：手部与裙摆边缘做写实运动模糊；面部与身体核心保持清晰；背景加微焦外光流强化速度感。”

多轮编辑建议（很重要）

Gemini 支持多轮对话式编辑，别试图一次下 10 个要求。推荐顺序：

结构/清理：去杂物、换背景、裁切构图
氛围/光色：调色、光效、季节/天气转换
细节：皮肤纹理、材质锐化、局部对象替换

每轮只改 1-2 件事，成功率更高，也更容易回溯。

总的来说，Gemini 做图片编辑/扩图/修图的核心价值，是把“PS 里半小时的选区+蒙版+调色”压缩成“上传+一句话”，但你得学会把需求说清楚：范围锁定、不变项声明、融合约束，这三点决定成品是不是“能发的图”。不想在账号、网络、环境上磨半天，想先直连最新模型试试这些图像指令合不合手的，去 se.zzmax.cn 试一试就行，传两张图就有数了。