用 GPT-Image-2 生成旅行纪念风格插画，只需输入地点和心情在库拉KULAAI（t.kulaai.cn）上试了一

在库拉KULAAI（t.kulaai.cn）上试了一下午 GPT-Image-2 的旅行插画功能，发现这东西比我预想的要好用得多。不需要任何设计基础，输入地点和几句心情描述，就能拿到一张可以直接发朋友圈或打印装框的插画。下面把测试过程、提示词写法和一些踩坑经验分享出来。

起因：不想再用滤镜了

上个月去了一趟泉州，拍了不少照片，但回来翻相册的时候总觉得差点什么。滤镜调来调去，照片还是照片，缺少那种"旅行记忆"的感觉。

以前想把旅行照片变成插画风格，要么找设计师画（贵且慢），要么用 Prisma 之类的滤镜 App（效果单一且假）。现在有了 GPT-Image-2，事情变得不一样了——它不是简单地给照片套滤镜，而是根据你的描述从零生成一张全新的插画，风格、构图、色调都可以控制。

基础操作：最简单的提示词写法

先跑一个最基础的版本。假设你刚从京都回来，想画一张岚山竹林的纪念插画：

京都岚山竹林，阳光穿过竹叶洒在石板路上，远处有一个撑着透明伞的人影，水彩风格，温暖的午后光线

把这个提示词输进去，medium 档，方图，等大概 20 秒，出来的效果已经相当不错了。竹林的层次感、光影的穿透感、水彩那种微微晕染的边缘，都处理得很到位。

再试一个完全不同的场景：

大理洱海边，黄昏，一个女孩骑着电动车沿海堤公路走，远处是苍山和粉色的晚霞，日系插画风，柔和的暖色调

这张出来也很惊艳。海面的反光、远处苍山的轮廓、电动车的动态感，都画出来了。最关键的是——它没有那种 AI 生图常见的"过度精致"的感觉，反而有一种手绘的质朴味道。

进阶：加入心情和情绪

基础版只描述了场景，进阶版应该有"人"的情感在里面。这是旅行插画和风景图最大的区别。

试试这个：

厦门沙坡尾的旧渔船码头，傍晚，我坐在堤坝上喝着瓶装豆奶看海，海风把头发吹乱了，画面有一种"什么都不想做"的慵懒感，复古胶片色调，轻微颗粒感

注意最后一句"什么都不想做"——这不是场景描述，而是情绪描述。GPT-Image-2 对这类抽象情绪的理解比上一代强很多，它会把这种慵懒感转化成画面语言：低饱和度的色调、松弛的构图、略微模糊的远景。

再举个例子：

凤凰古城的夜晚，沱江边的吊脚楼倒映在水里，我和朋友坐在河边的小酒馆里，桌上放着几瓶啤酒和一碟花生，水彩速写风格，有一种"旅行中最好的夜晚"的感觉

"旅行中最好的夜晚"这种模糊的情绪表达，模型居然接住了。画面里灯笼的暖光、江面的倒影、人物放松的姿态，整体传递出来的氛围确实有那种感觉。

几个实测有效的提示词结构

测了大概 50 多张图之后，我总结出一个比较稳定的提示词结构：

地点 + 时间 + 核心场景 + 情绪/氛围 + 风格 + 细节修饰

每个部分的作用：

地点： 决定画面的基础元素（建筑风格、植被、地貌）
时间： 决定光线方向和色温（清晨偏冷、黄昏偏暖、夜晚偏深蓝）
核心场景： 你最想记住的那个画面（在做什么、看到了什么）
情绪/氛围： 这是让插画从"好看"变成"有感觉"的关键
风格： 水彩、油画、日系插画、复古海报、速写、像素风……
细节修饰： 胶片颗粒、手绘笔触、模糊边缘、噪点……

按这个结构写，基本不会翻车。

风格对比：不同画风适合不同旅行场景

同一个场景，换不同风格，出来的感觉完全不一样。我用"丽江古城的小巷"做了对比测试：

水彩风格： 最适合古镇、自然风光。水彩的那种晕染感天然带有一种"记忆的模糊感"，很适合表达"去过但已经有点记不清"的旅行场景。

日系插画风格： 最适合城市、街道、咖啡馆。线条干净、色彩明快，有一种吉卜力动画的感觉，特别适合发社交媒体。

油画风格： 最适合大场景、山川湖海。油画的厚重感和笔触能让壮阔的风景更有力量，但用在小巷子这种场景会显得太重。

速写风格： 最适合记录"在路上"的随手一拍。铅笔线条、简单的色彩填充，有一种旅行手账的感觉，很适合打印出来贴在墙上。

复古海报风格： 最适合标志性地标。把埃菲尔铁塔、故宫、富士山做成 1950 年代旅行海报的样子，怀旧感拉满，送人当礼物也很合适。

和其他模型的对比

同样一组提示词，我分别用 GPT-Image-2、Midjourney v6 和 Stable Diffusion 3.5 跑了对比：

文字渲染： GPT-Image-2 完胜。如果你的插画里需要出现地名、日期、一句话感悟，只有 GPT-Image-2 能把中文文字画对。Midjourney 的中文还是一坨乱码，SD3.5 稍微好一点但也不行。

风格一致性： Midjourney 在审美天花板上依然更高，尤其是油画和摄影风格。但 GPT-Image-2 在水彩和插画风格上的表现已经非常接近，差距没有以前那么大了。

可控性： GPT-Image-2 对提示词的遵循度明显好于 Midjourney。你说"右边放一棵树"，它就真的在右边放一棵树。Midjourney 经常自作主张改构图。

速度： GPT-Image-2 medium 档大约 20 秒，Midjourney 大约 30-60 秒，SD3.5 本地跑大约 5-10 秒（取决于显卡）。

总结：如果你的旅行插画需要带文字（地名、日期、一句话），GPT-Image-2 是目前唯一靠谱的选择。如果纯画面不带文字，Midjourney 的审美上限更高。

实用建议

关于尺寸。 如果是发朋友圈或小红书，方图 1024×1024 就够了。如果想打印装框，建议选 high 档最大尺寸，虽然贵一点但打印出来不会糊。

关于保存和管理。 建议每次生成后把提示词也一起记录下来。好的提示词是可复用的，下次去别的地方换个地名就行。我现在的做法是在手机备忘录里建一个"旅行插画模板"，每次出门前花五分钟改几个关键词。

关于成本。 medium 档每张大约 3 毛 8 人民币，一个旅行目的地画 5-10 张不同场景，总成本不到 4 块钱。比找设计师画一张便宜太多了。

关于隐私。 旅行插画一般不涉及敏感信息，但如果你在提示词里写了具体的酒店名、门牌号之类的东西，注意这些信息会上传到服务器。建议只写地名和场景描述，不要写太精确的个人位置。

趋势观察：AI 生成内容正在改变"纪念品"这件事

从更宏观的视角看，GPT-Image-2 做的这件事，本质上是在重新定义"旅行纪念品"。

以前的旅行纪念品是明信片、冰箱贴、钥匙扣——标准化的商品，谁去那个地方都买一样的东西。后来有了照片，纪念变成了"我拍到了什么"。再后来有了滤镜，纪念变成了"我怎么呈现我拍到的东西"。

现在，纪念变成了"我想要一个什么样的记忆"。你不需要真的站在那个角度拍到那个画面，你只需要记得那个下午你在海边坐了很久，风很舒服，天很蓝——然后把这些感受转化成提示词，AI 会帮你把这个记忆变成一张图。

这是一种从"记录"到"创作"的转变。照片是记录现实，插画是表达感受。GPT-Image-2 让没有绘画能力的人也能完成这个转变。

当然，这也带来一个问题：当 AI 生成的"记忆"越来越逼真，我们会不会开始分不清哪些是真实经历，哪些是 AI 补全的？这是一个没有标准答案的问题，但值得在使用的过程中保持觉察。