我是如何用 Banana 接到上万元商单的

34 阅读10分钟

"这种难度大的,就找广告公司,180 一个。"

甲方在微信上跟我说这话的时候,语气很随意。就是告诉你一个事实:这活有人干,价格也不贵,你不用操心。

但我脑子里已经在转了。

我回了一句:"晚点发给你。"

10 分钟后,他回了三个字:

"感觉不错 😁"

后来这个 180 块的活,变成了上万块的持续合作。

这篇文章就记录那 10 分钟里到底发生了什么。


起因:一段闲聊

那天上午 10:32,我跟客户在微信上聊天,没有任何预谋,随口问了一句:

"你们现在的物料宣传资料是自己弄还是外包出去的?"

客户说:

"自己弄,有时候外包。小活动自己做,搞不定的外援。"

我又问每个月成本多少。

"那没多少钱,一个酒店,一年广告费用几千块,还包物料。"

然后他发了一个 18MB 的 PDF 过来——三折页设计稿。

"这种难度大的,就找广告公司,180 一个。"

以下是原始聊天截图,一字未改:

聊天记录:了解需求

注意这句话。他不是在问我能不能做,他是在跟我解释他们的流程。

但我听到的是另一件事:一个被定义为"难"的活,市场价 180。

我心想——能不能用 AI 跑出来?

我回:"我在想怎么弄。"

客户说"试一试",发了个笑脸,又说:

"我给你发个文案,出一个。"

"比如就这个。"

然后把那份三折页设计 PDF 又转发了一遍。

我说:"晚点发给你。"

行,接了。这个决定后来证明价值远超 180。


拆图:30 秒搞定的事

三折页两页 PDF,每页 3 个面板,共 6 个面板。

一句话给 Claude Code:

"我想把三折页设计.pdf 的图片导出"

它用 PyMuPDF 导出两张 4320×2160 的高清 PNG,再自动拆成 6 张面板图。macOS 的 pip 被锁了,Claude 自己建了虚拟环境绕过去,没让我操心。

这步不值得多说。值得说的是下一步。


诊断:AI 说了一句让我印象很深的话

我没有直接让 AI 改图。

我做了一件更重要的事——我先问它"问题出在哪"。

"如果我想提升这个图的质感,我该怎么做?对标五星级酒店标准,但品牌和文案保留当前的。"

Claude 逐张看完 6 个面板,给出了一份诊断。整篇报告信息量很大,但真正戳到我的是一句话:

当前设计像"商务快捷酒店促销传单",目标是变成"五星级酒店会员手册"——核心差距不在内容,在克制。

"不在内容,在克制。"

这句话你细品。它不只是在说设计,它在说一种思维方式——高端不是加东西加出来的,是减东西减出来的。

具体来说三个问题:

  1. 视觉噪音过重——烟花、波浪、宝塔、雕像、中国结纹理同时出现。五星级的核心原则是克制,不是堆砌。
  2. 留白严重不足——元素堆满每个面板。高端感来自"空"而非"满"。
  3. 配色过于饱和——大面积亮金 + 深棕渐变像快捷酒店,五星级更多用哑光金做点缀。

为了验证这不是一家之言,我把同样的图发给 Gemini,让它独立分析。

结论几乎一模一样。

两个完全不同的 AI,不同的表述,同一个结论。设计问题不是"我觉得不好看",是客观存在的。

好,方向有了。接下来要出图。

然后——我卡住了。


踩坑三连:差点放弃

这是整篇文章最真实的部分。

❌ 第一次:直接上传 PDF

我把 PDF 扔给 Gemini,说"照着这个风格重新设计"。

Gemini:无法操作。

它没办法同时处理 PDF 解析和图像生成。好吧,换个方式。

❌ 第二次:JSON 数据驱动

那就把三折页所有文案整理成结构化 JSON——酒店名、会员等级、积分规则、礼品清单,全写好,发过去。

生成了。

但图完全不对。一次性生成整个三折页对 AI 来说太复杂了,它根本处理不过来。

❌ 第三次:分镜图 / 2x3 平铺

又试了"分镜图"、"2x3 平铺"各种说法。

结果:每张图的风格都不一样。AI 很难一次生成多面板且保持一致。

连续三次失败。

到这里说实话我有点慌了。客户那边我说了"晚点发给你",如果搞不出来,那就是当面打脸。

我盯着屏幕想了一会儿。

然后换了一个完全不同的思路。


转折:一个改变一切的策略

不让 AI 做图了。先让它当顾问。

我上传了原始封面图,但不是让 Gemini 做图,而是问它:

"我想提升这张照片质感,达到超五星级酒店的标准,你给我一些建议。"

Gemini 给了一份非常专业的分析。其中一句话我直接截图保存了:

"奢华感的视觉公式 = 稀缺感 + 精细度 + 物质感。目前拼贴感过重,破坏空间真实感。"

奢华感的视觉公式。AI 说出这种话的时候,你就知道它真的理解了。

然后我说:"你帮我提升一下,生成图片给我。"

第一张图出来了。格式不对,竖版变横版了。

我说"应该是 9:16"。

改了。这次——对了。

我看着那张图,心里一松:这条路走得通。

接下来就是流水线作业。逐张上传原始面板图,每次只说一句话:

"按照你最开始的图片风格,继续提升这张图片。"

一张一张出,6 张面板全部统一风格。

核心经验:跟 AI 生图,每次失败后缩小自由度。不给 PDF 给图片,不要求整体给单张,不描述风格给参考图。越具体越好。

从三连败到六连胜,转折点就是一个字:拆。


彩蛋:悟空和哪吒

6 张标准面板做完后,活已经干完了。但我想多做一步。

正值马年春节前,让 Gemini 在封面上加了"马年大吉"元素。

然后灵机一动,打了一句话:

"加上黑神话悟空 IP 形象在酒店沙发上,魔童哪吒拖着箱子在旁边。"

30 秒。

悟空坐在酒店大堂沙发上,哪吒拖着行李箱站在旁边。

这个画面我自己看了都笑了。

这种创意如果让广告公司做,光找素材、抠图、调光影、合成就得半天。AI 一句话搞定。就算最终不用这个方案,试错成本也极低——而恰恰是这种"随手一试"的创意,往往是打动客户的关键。

注:创意图仅用于内部方案沟通,不作商业投放。

还有个坑:Gemini 在同一个对话窗口生图超过 5–6 张后风格会漂移。解决方法很简单——新开窗口,重新上传参考图建立风格锚点。


收尾:去水印、合成、交付

Gemini 生成的每张图右下角都有星形水印。

我用 GeminiWatermarkTool 批量去除——它用数学方法(反向 alpha 混合)精确还原被水印覆盖的像素,比 AI 修复干净得多。去完水印,ffmpeg 拼整图,方便对比和交付。

提醒:关于水印处理务必遵守平台协议与版权规范。

到这里,从打开 PDF 到准备交付,大概 10 分钟。


交付的那一刻

回到微信。时间 12:32——距离收到需求过了两个小时,但中间大部分时间在休息,真正动手大概 10 分钟。

我发了原始三折页和 AI 升级版的对比图,附了一句话——故意说得轻描淡写:

"简单提升了一下质感,超五星级标准。"

等了大概 30 秒。

"感觉不错 😁"

聊天截图放在这里,你品品这个节奏——10:32 收到需求,12:32 交付成品:

聊天记录:交付反馈

聊天记录:创意版封面

四个字,一个表情。

但这四个字的分量,做过甲方交付的人都懂——客户不说问题,就是最好的反馈。

原始 vs 升级对比图

随后我把改进思路整理成面板级文档——每份包含当前问题分析、布局图、逐项修改指令、需去掉/保留的元素清单——交给 Banana Pro 设计师做最终落地。


真正的故事:从 180 到上万

如果文章到这里就结束了,那只是一个"AI 做设计还挺快"的故事。

但真正让我写这篇文章的原因,是后面发生的事。

三折页交付后,客户没有消失。他紧接着追加了需求:

酒店宣传海报。

竖版系列,5 张。同样的流程——Claude Code 做分析和编排,Gemini 生图,去水印,合成交付。

酒店海报系列

然后是酒店亮点展示图。

酒店亮点展示

三折页、海报、亮点图,加上后续的持续物料需求,累计下来就是标题里的"上万元商单"。

起点是什么?一个 180 块的活,10 分钟交付。

客户追加需求不是因为我便宜,是因为他觉得"这人靠谱,出活快,质量还行"。

一次 10 分钟的交付建立的信任,比任何推销话术都有效。


三条真话

写到最后,不想说"总结",说三条真话。

第一条:AI 生图不是替代设计师,是替代"不敢想"。

悟空坐在酒店沙发上、哪吒拖着箱子——这种想法以前想到了也不敢提,执行成本太高。现在一句话 30 秒出图,不满意就重来。AI 真正释放的不是生产力,是创意的试错自由。

第二条:跟 AI 沟通和跟人沟通一样——越具体越好。

"帮我设计一个三折页"注定失败。"按照这张参考图的风格,优化这一张面板"才能出活。我踩了三个坑才学会一件事:每次失败后缩小自由度。

第三条:工具链比单个工具重要 10 倍。

PDF 导出 → 图片拆分 → 设计分析 → AI 生图 → 去水印 → 合成整图 → 交付客户。每一步单独看都不复杂,但串起来就是一条完整的商业交付流程。Claude Code 在中间充当全流程编排——分析需求、调用工具、处理图片、生成文档,全部在一个终端里完成。

单个工具是锤子,工具链是流水线。锤子人人都有,流水线才是壁垒。


踩坑清单

我干了啥结果
把 PDF 直接扔给 Gemini❌ 无法处理
用 JSON 让 Gemini 生整套三折页❌ 图不对,太复杂
让 Gemini 生分镜图❌ 风格不一致
先当顾问分析,再逐张优化✅ 分而治之成功
同一窗口生图超过 6 张⚠️ 风格漂移,需换新窗口
macOS 直接 pip install❌ externally-managed-environment
ffmpeg 处理中文路径⚠️ 易编码问题,建议英文路径

完整工具链

工具作用
Claude Code全流程编排:分析、生文档、调工具
GeminiAI 生成设计参考图
PyMuPDFPDF 导出高清 PNG
Pillow图片裁切(三折页拆面板)
GeminiWatermarkTool去除 Gemini 水印(反向 alpha 混合)
ffmpeg图片合成整图
Banana Pro设计师落地执行

高端感不是"加东西"加出来的,是"减东西"减出来的。设计如此,跟 AI 沟通也如此。

你有没有用 AI 接过类似的商单?评论区聊聊,踩过的坑比方法论有用。