Gemini 3 Pro 生图实测:2K和4K同价,一张不到1毛钱

0 阅读1分钟

做电商和自媒体的朋友应该都有体感:AI生图虽然卷得厉害,但真正批量用起来,成本还是个问题。

Midjourney 包月 $30 起步有上限,DALL·E 3 按张收费 4K 还要加钱,Stable Diffusion 本地跑又得折腾显卡。

最近 Google 放出了 Gemini 3 Pro Image Preview,支持 API 调用生图。我拿来测了一下,记录下效果和成本。

实测效果

以下全部通过 API 一次生成,零后期。

场景一:电商产品白底图

Prompt:一双白色运动鞋放在干净的白色背景上,柔和的灯光,专业摄影风格,4K高清

电商白底图

光影自然,鞋面纹理清晰,白底干净。直接拿去上架详情页问题不大。

场景二:美食摄影

Prompt:一碗精致的日式拉面,热气腾腾,俯拍角度,暖色调灯光,美食杂志风格,4K高清

美食摄影

汤头质感、面条光泽、配料摆盘都到位。做外卖平台商家图或美食号封面够用。

场景三:生活方式

Prompt:一个年轻女性坐在咖啡厅里用笔记本电脑工作,窗外是城市街景,温暖的自然光,4K高清

生活方式

人物自然、光线通透。公众号封面、小红书配图都合适。

成本

这个模型有意思的地方:2K 和 4K 输出同价。

我用的中转站报价是 ¥0.095/张(2K/4K 同价),算一下:

  • 日预算 ¥500 → 日产 5,263 张
  • 月产约 15.8 万张
  • 对比 DALL·E 3 同预算约 860 张

差距是数量级的。当然中转站价格各家不同,这个价格不一定人人都能拿到,仅供参考。

接入方式

走标准 OpenAI 兼容接口,Python 示例:

from openai import OpenAI

client = OpenAI(
    api_key="你的key",
    base_url="你的中转站地址"
)

response = client.chat.completions.create(
    model="gemini-3-pro-image-preview",
    messages=[{
        "role": "user",
        "content": "一双白色运动鞋,白色背景,专业产品摄影,4K"
    }],
    max_tokens=4096
)
print(response.choices[0].message.content)

兼容 OpenAI SDK,改个 base_url 和 model 就能跑。

适合什么场景

  • 电商团队批量出白底图、场景图
  • 自媒体做封面、配图
  • 设计师快速出概念图
  • 独立开发者做营销素材

总结

Gemini 3 Pro 的生图质量在商用场景够用,成本优势明显。Prompt 都贴了,感兴趣可以自己试试。

模型名:gemini-3-pro-image-preview,支持 OpenAI 格式调用的中转站基本都有。