一次用 Vibe Coding 解决真实生图工作流痛点的 AI 实战案例。

0 阅读5分钟

大家好,我是小黄,AI编程,AI洞察,AI实战案例分享

👇点击关注,每篇文章能给你带来一定的收获👇

哈喽,大家好,我是小黄,昨天更新了coze工作流,今天又顺着这个方向折腾了一个小工具。

这次做的是一个 AI 生图程序,主要用来调用第三方平台上的生图模型。

至于为什么做这个AI生图程序,当然是因为平台生图蛮贵的,第三方平台上直接使用又各种麻烦,用的不顺心不顺手。为了更加方便的生图,所以我干脆用 vibe coding 做了一个自己的生图工作台。

而且不止gpt-image2模型,还有香蕉2/香蕉 pro都集成了。实测下来体验还阔以,并发啊,连续同个提示词生成多张等都很方便。图片拖动到对话框,历史留存等都能很直观的看到。

目前我比较倾向于调用第三方平台的生图模型。原因很现实:价格相对更优惠。直接在 Coze 工作流里调用时,我发现它更适合把流程跑通,而不是作为一个高频使用的生图工作台。

我真正需要的是一个更轻、更直观的界面:打开以后就能选择模型,输入提示词,拖入参考图,连续生成多张结果,并且能方便地回看历史记录。

换句话说,模型能力已经有了,接口也能调用了,但中间缺一个真正适合自己日常使用的操作层。

这就是我这次想解决的问题:能不能用 AI 编程,快速做一个自己的生图小程序

于是我用 Vibe Coding 的方式,快速做了一个生图小程序。

它的核心作用很简单:把第三方平台上的多个生图模型接入到一个统一界面里,让我可以更方便地调用、测试和管理生成结果。

目前这版还不是一个完整产品,也没有追求很复杂的功能。我的目标是先把自己最常用、最影响效率的几个动作打通。

程序展示

1、多模型统一调用

目前程序里已经集成了三个模型

2、同个提示词连续生成多张图

生图有一个很明显的特点:同一个提示词,不同批次生成出来的结果可能差异很大。

所以我做了连续生成多张图的功能。这样一来,不需要反复复制粘贴提示词,也不用一张一张手动点。一次输入提示词,就可以连续跑出多张结果,方便我做风格和稳定性对比。

3、支持拖拽图片上传

除了文生图,我也经常会做图生图、参考图生成、黑白图上色之类的测试。

所以我把图片拖拽上传也做进去了。需要参考图时,直接把图片拖到对话框里就可以,不用再绕一堆上传按钮。支持网站的图片复制粘贴,也支持本地的图片复制粘贴,也支持上传按钮上传,体验感拉满。

4、历史结果留存本地,方便回看

很多时候,生图不是生成完就结束了,而是需要反复对比:哪张效果更好?哪个提示词更稳定?哪个模型更适合当前场景?

所以我也做了本地历史结果留存。之前生成过什么图、用了什么提示词、选择了哪个模型,都可以更直观地回看。

这版界面还不算特别精致,但主流程已经跑通了。对我来说,现阶段最重要的不是把页面做得多漂亮,而是先让它真正解决自己的使用问题。

我也简单测了一些出图效果,比如文生图、图生图、黑白漫画上色这些场景,都可以放进这个工具里测试。都能跑通,而且1/2/4K的分辨率还有一些尺寸都做了可以选择。

出图效果展示

这张是图片黑白漫画上色,效果还是可以的。

AI出图程序做下来的感受

1、AI编程很适合解决自己的小痛点

这次做下来,我最大的感受是:AI 编程最适合解决这种“自己刚好需要,但现成工具又不完全顺手”的小问题。

它不一定一上来就要做成一个完整产品,也不一定要追求商业化。只要能围绕一个真实需求,把流程跑通,就已经很有价值,如果你们想基于这个程序定制成你们的地址可以找我。

2、工具不一定要大,但一定要贴近真实使用场景

这类小工具的价值,不在于功能有多炫,而在于它是不是刚好卡在你的工作流里。

对我来说,统一模型入口、批量生成、拖拽上传、历史回看,这几个功能都很小,但组合在一起,就能明显提升使用体验。

这次的小工具,本质上不是为了做一个多复杂的产品,而是一次很典型的 AI 实战:发现自己工作流里的卡点,然后用 AI 编程快速补一个工具。

以前这种想法可能会停留在“有空再做”,因为从设计、开发到调试,成本都不低。

但现在有了 Vibe Coding,很多小工具可以先快速做出一个能用的版本,再根据真实使用体验一点点优化。

这也是我最近越来越喜欢 AI 编程的原因。它不是只用来写代码,而是能让很多原本停留在脑子里的小想法,变成真正可以使用的工具,有需要该程序的评论区留言666

以上,就是今天的 AI 实战案例分享,非常感谢各位老板耐心观看。