全程只需自然语言对话,从分镜脚本到成品图,一条龙搞定。
前言:为什么我折腾这个?
我一直想把女儿和她喜欢的卡通人物生成连环画的想法,现在AI已经这么发达了,能不能有简单、免费的方法用AI自动生成一套完整的连环画?
不是那种随便生成几张图,而是有完整故事线、人物设定统一、分镜连贯的真正意义上的漫画。
最近我用 Claude Code + baoyu-skills + 阿里百炼 实现了这个想法,今天把完整流程分享出来。
第一步:安装 AI 绘画技能包
打开 Claude Code,我只说了一句话:
请帮我安装 github.com/JimLiu/baoyu-skills 中的 Skills
Claude Code 自动完成了:
- 克隆仓库
- 安装依赖
- 配置技能
里面包含 baoyu-comic(连环画生成)、baoyu-imagine(AI生图)等20+技能。
第二步:给一个参考图,让AI记住主角长相
我上传了一张小朋友的照片作为参考:
这是我家小朋友葵宝,请记住她的样子
Claude Code 生成了详细的角色设定描述:
3-5岁中国小女孩,双丸子头配粉色绒球装饰,穿着红色中式棉服,白毛领,圆脸蛋,大眼睛,呆萌可爱
这样后面每一页的人物都能保持一致。
第三步:说个故事主题,AI自动生成分镜脚本
我只给了一个标题:
葵宝和Hello Kitty的超市奇遇
Claude Code 自动生成了8页完整分镜脚本:
| 页码 | 场景 | 核心情节 |
|---|---|---|
| 封面 | 超市门口 | 葵宝和Hello Kitty的超市奇遇 |
| 第1页 | 出发去超市 | 蝴蝶结发光,冒险开始 |
| 第2页 | 进入迷你国 | 货架变巨大,商品会动 |
| 第3页 | 饼干桥 | 踩着巧克力豆过河 |
| 第4页 | 酸奶河 | 用净水手电筒找种子 |
| 第5页 | 果冻迷宫 | 留猫爪印记找出口 |
| 第6页 | 云端货架 | 光束托下奶油帽子 |
| 第7页 | 盛大派对 | 感谢派对,吃蛋糕 |
| 第8页 | 回到妈妈身边 | 蝴蝶结多了枚勋章 |
每一页都有2x2四格布局、详细的画面描述、文字气泡。
第四步:自动生成生图提示词
针对每个分镜,Claude Code 自动生成了结构化提示词:
四格漫画《饼干桥》kawaii可爱风格,带中文文字气泡
角色设定:
- 葵宝:3-5岁中国小女孩,双丸子头配粉色绒球,红色中式棉服
- Hello Kitty:白色小猫,蝴蝶结发光束
画面布局(2x2网格):
左上格:葵宝拍胸脯,Hello Kitty点头...
右上格:巨大的饼干桥,桥下巧克力河...
...
提示词包含:
- 画风要求(kawaii日漫可爱风格)
- 角色一致性描述
- 每格的画面内容
- 文字气泡内容
- 比例要求(3:4竖版)
第五步:调用AI生图API
这里Claude code会自动使用阿里百炼的免费额度(通义万象 qwen-image-2.0-pro),Claude Code 批量生成了9张图:
npx bun .agents/skills/baoyu-imagine/scripts/main.ts \
--promptfile prompts/01-cover.md \
--image 01-cover.png \
--provider dashscope \
--size 1152x1536
每张图大约30秒生成,全程自动化。
整个流程耗时多久?
| 步骤 | 耗时 |
|---|---|
| 安装技能 | 2分钟 |
| 上传参考图 | 1分钟 |
| 生成脚本 | 3分钟(AI自动) |
| 生成提示词 | 5分钟(AI自动) |
| 批量生图 | 约15分钟(9张图) |
总计:约25分钟,从零到一套完整连环画。
技术要点总结
- 角色一致性:通过详细的文字描述 + 参考图保持人物统一
- 分镜脚本:让AI先生成完整故事结构,再细化每一页
- 提示词模板:使用固定格式确保风格一致
- 批量生成:用脚本自动化调用API
局限性
- AI生成的中文文字有时会乱码,建议后期用PS加字
- 复杂场景的人物一致性仍需微调
- 免费API有额度限制
写在最后
以前做一套连环画,从构思、分镜、线稿、上色,少说也要几周。
现在用AI辅助,20来分钟搞定。
AI不会取代创作者,但会让创作变得更简单、更高效。
技术的意义,就是让更多人能够表达自己的故事。
如果这篇对你有帮助,点个赞吧! 👍
有问题欢迎评论区交流~