做电商和自媒体的朋友应该都有体感:AI生图虽然卷得厉害,但真正批量用起来,成本还是个问题。
Midjourney 包月 $30 起步有上限,DALL·E 3 按张收费 4K 还要加钱,Stable Diffusion 本地跑又得折腾显卡。
最近 Google 放出了 Gemini 3 Pro Image Preview,支持 API 调用生图。我拿来测了一下,记录下效果和成本。
实测效果
以下全部通过 API 一次生成,零后期。
场景一:电商产品白底图
Prompt:一双白色运动鞋放在干净的白色背景上,柔和的灯光,专业摄影风格,4K高清

光影自然,鞋面纹理清晰,白底干净。直接拿去上架详情页问题不大。
场景二:美食摄影
Prompt:一碗精致的日式拉面,热气腾腾,俯拍角度,暖色调灯光,美食杂志风格,4K高清

汤头质感、面条光泽、配料摆盘都到位。做外卖平台商家图或美食号封面够用。
场景三:生活方式
Prompt:一个年轻女性坐在咖啡厅里用笔记本电脑工作,窗外是城市街景,温暖的自然光,4K高清

人物自然、光线通透。公众号封面、小红书配图都合适。
成本
这个模型有意思的地方:2K 和 4K 输出同价。
我用的中转站报价是 ¥0.095/张(2K/4K 同价),算一下:
- 日预算 ¥500 → 日产 5,263 张
- 月产约 15.8 万张
- 对比 DALL·E 3 同预算约 860 张
差距是数量级的。当然中转站价格各家不同,这个价格不一定人人都能拿到,仅供参考。
接入方式
走标准 OpenAI 兼容接口,Python 示例:
from openai import OpenAI
client = OpenAI(
api_key="你的key",
base_url="你的中转站地址"
)
response = client.chat.completions.create(
model="gemini-3-pro-image-preview",
messages=[{
"role": "user",
"content": "一双白色运动鞋,白色背景,专业产品摄影,4K"
}],
max_tokens=4096
)
print(response.choices[0].message.content)
兼容 OpenAI SDK,改个 base_url 和 model 就能跑。
适合什么场景
- 电商团队批量出白底图、场景图
- 自媒体做封面、配图
- 设计师快速出概念图
- 独立开发者做营销素材
总结
Gemini 3 Pro 的生图质量在商用场景够用,成本优势明显。Prompt 都贴了,感兴趣可以自己试试。
模型名:gemini-3-pro-image-preview,支持 OpenAI 格式调用的中转站基本都有。