我用AI做了一个短剧生产工具,从剧本到视频全自动化
前言:短剧创作者的痛点
最近在知乎上经常看到有人问:"想做短剧/短视频,但不会画画、不会建模、也没有拍摄团队,怎么办?"
作为一个技术宅,我的答案是:用AI啊!
于是我花了一段时间,做了这个工具——花火 Studio(Huahuo Studio),一个基于AI的短剧生产工具,能够帮你从剧本到视频的全流程自动化创作。
今天就来分享一下这个工具,以及我在开发过程中的一些思考。
一、花火 Studio 是什么?
简单来说,花火 Studio 是一个桌面应用,让你用AI生成短剧/短视频。
你只需要:
写好剧本(或者让AI帮你写)
点几下鼠标
等AI干活
导出视频
就这么简单。
核心功能一览
🎬 剧本创作
支持导入和编辑剧本
AI自动解析剧本,提取场景、角色、分镜信息
支持多种剧本格式
👤 角色管理
管理角色信息(姓名、性别、年龄、性格等)
AI生成角色形象(头像、多视角设定图)
AI智能生成角色外貌描述
🏞️ 场景管理
编辑场景信息(地点、时间、氛围等)
AI生成场景参考图
场景与分镜自动关联
📸 分镜制作
从剧本自动生成分镜
编辑分镜画面描述
AI生成分镜参考图
AI生成分镜视频(图生视频)
支持批量生成
🎨 多种视觉风格
动画风格:日式2D动画、3D动画、儿童动画、粘土动画、水彩、像素、素描
真人风格:现代都市、年代剧、奇幻、科幻、纪录片
大师风格:宫崎骏、新海诚、上海美影厂、迪士尼、皮克斯、吉卜力、赛博朋克、黑色电影、韦斯·安德森
📦 渲染与导出
渲染任务队列管理
支持视频导出
二、为什么要做这个工具?
- 短剧市场火爆,但创作门槛高
最近几年短剧市场爆发式增长,但传统的短剧制作需要:
编剧
导演
演员
摄影师
后期团队
大量资金
对于个人创作者或小团队来说,门槛太高了。
- AI技术成熟,但工具分散
现在AI图像生成(Stable Diffusion、Midjourney)、AI视频生成(Runway、Pika)、大语言模型(GPT、Claude)都已经很成熟了。
但问题是:这些工具都是分散的。
你需要:
在ChatGPT里写剧本
在Midjourney里生成角色
在Runway里生成视频
在剪映里剪辑
来回切换,效率低下。
- 我想要一个一体化的解决方案
所以我做了花火 Studio,把整个流程整合到一个桌面应用里:
剧本 → 角色 → 场景 → 分镜 → 视频 → 导出
全流程自动化,一站式解决。
三、使用流程演示
下面我用一个实际案例来演示一下使用流程。
Step 1: 创建项目
打开花火 Studio,创建一个新项目,比如叫"霸道总裁爱上我"(别笑,这题材真的火)。
Step 2: 导入剧本
写好剧本,或者让AI帮你写。比如:
场景1:公司大厅 - 白天
李雪匆忙跑进公司大厅,手里拿着咖啡。
李雪:糟了,要迟到了!
(李雪撞到了陆晨,咖啡洒在了他的西装上)
陆晨(冷冷地):你知道这套西装多少钱吗?
李雪(慌张):对不起对不起!我赔!
场景2:总裁办公室 - 白天
陆晨坐在办公桌前,看着李雪的简历。
陆晨:有意思,居然是新来的实习生。
导入剧本后,点击"AI解析",花火 Studio会自动:
识别出角色:李雪、陆晨
提取场景:公司大厅、总裁办公室
生成分镜:每个镜头的描述
Step 3: 完善角色
进入"角色管理"页面,可以看到AI已经识别出了李雪和陆晨。
点击"生成角色形象",AI会根据剧本内容生成角色的外貌描述和参考图。
比如:
李雪:20岁左右,清纯可爱,长发,大眼睛,穿着简单的职业装
陆晨:30岁左右,冷峻帅气,短发,深邃的眼神,穿着高级西装
你可以手动调整描述,然后重新生成,直到满意为止。
Step 4: 完善场景
进入"场景管理"页面,编辑场景信息:
公司大厅:现代化的办公楼大厅,明亮,大理石地面,落地窗
总裁办公室:豪华的办公室,大落地窗,城市景观,黑色办公桌
点击"生成场景图",AI会生成场景的参考图。
Step 5: 生成分镜
进入"分镜制作"页面,可以看到AI已经自动生成了分镜列表。
每个分镜都有:
场景
角色
动作描述
台词
你可以编辑分镜描述,然后点击"生成分镜图",AI会生成每个镜头的静态图片。
Step 6: 生成视频
分镜图生成后,点击"生成视频",AI会基于分镜图生成视频片段(图生视频)。
这一步会比较慢,因为视频生成需要时间。你可以批量提交任务,然后去喝杯咖啡。
Step 7: 导出
所有视频片段生成后,进入"导出"页面,点击"导出视频",花火 Studio会把所有片段合并成一个完整的视频。
搞定!
四、技术实现
作为一个技术分享,我也简单说说技术栈。
前端技术栈
React 19 + TypeScript:现代化的前端框架
TailwindCSS:快速构建UI
Electron 33:跨平台桌面应用
TanStack Router:类型安全的路由
Zustand:轻量级状态管理
Radix UI:无障碍的UI组件库
后端技术栈
SQLite + Drizzle ORM:本地数据库,存储项目数据
better-sqlite3:高性能的SQLite绑定
AI服务集成
花火 Studio支持多种AI服务:
图像生成
阿里云通义万相
API易(Gemini)
视频生成
阿里云通义万相(图生视频)
API易(Sora/VEO)
大语言模型
OpenAI兼容API
阿里云通义千问
Gemini
你可以根据自己的需求和预算选择不同的服务。
为什么选择桌面应用?
有人可能会问:为什么不做成Web应用?
原因有几个:
数据隐私:剧本、角色、场景都是创作者的核心资产,本地存储更安全
性能:视频处理需要大量计算,桌面应用性能更好
离线使用:除了调用AI API,其他功能都可以离线使用
五、使用成本
很多人关心成本问题。
花火 Studio本身是开源免费的(MIT License),但调用AI服务需要付费。
以阿里云通义万相为例:
图像生成:约0.08元/张
视频生成:约1-2元/秒(5秒视频约5-10元)
一个10分钟的短剧,大概需要:
50-100个分镜
图像生成:50-100张 × 0.08元 = 4-8元
视频生成:50-100个片段 × 5秒 × 1.5元 = 375-750元
总成本约400-800元,相比传统拍摄(几万到几十万),成本大幅降低。
当然,如果你有自己的GPU,也可以部署本地模型(比如Stable Diffusion),成本会更低。
六、适用场景
花火 Studio适合哪些人?
- 个人创作者
想做短剧/短视频,但没有团队和资金
有创意,但不会画画、不会拍摄
- 小型工作室
需要快速产出内容
想降低制作成本
- 教育机构
制作教学视频
学生作品创作
- 企业宣传
制作产品宣传片
企业文化视频
七、未来规划
花火 Studio目前还是0.1.0版本,还有很多功能在开发中:
短期计划(1-3个月)
[ ] 支持更多AI服务(Midjourney、Runway等)
[ ] 优化视频生成质量
[ ] 添加音频生成(配音、背景音乐)
[ ] 支持字幕自动生成
中期计划(3-6个月)
[ ] 支持多语言(英文、日文等)
[ ] 添加模板库(常见短剧类型)
[ ] 支持团队协作
[ ] 云端同步
长期计划(6-12个月)
[ ] 支持实时预览
[ ] 添加特效库
[ ] 支持3D场景生成
[ ] 移动端应用
八、如何获取?
花火 Studio是开源项目,代码托管在GitHub:
GitHub地址:github.com/luoyedi-pr/…
快速开始
克隆项目
git clone github.com/luoyedi-pr/…
cd huahuo-studio
安装依赖
npm install
启动开发模式
npm run dev
系统要求
Node.js >= 18
Windows / macOS / Linux
首次配置
启动后,进入设置页面配置API:
数据存储路径:设置项目文件保存位置
LLM API:配置大语言模型API(用于剧本解析)
图像API:配置图像生成API(用于生成参考图)
视频API:配置视频生成API(用于图生视频)
九、总结
花火 Studio是我对"AI+内容创作"的一次探索。
我相信,AI不会取代创作者,但会让创作变得更简单。
传统的短剧制作需要大量的人力、物力、财力,但AI可以大幅降低门槛,让更多人能够实现自己的创意。
当然,花火 Studio还有很多不足,比如:
视频质量还不够稳定
生成速度还比较慢
功能还不够完善
但这只是开始。
随着AI技术的发展,我相信未来会有更多更好的工具出现,让内容创作变得像写文章一样简单。
如果你对这个项目感兴趣,欢迎:
⭐ Star项目
🐛 提交Issue
🔧 贡献代码
💬 加入讨论
让我们一起,用AI创造更多精彩的内容!
附录:常见问题
Q1: 生成的视频质量如何?
A: 取决于你使用的AI服务。目前主流的AI视频生成服务(如Runway、Pika、通义万相)质量都不错,但还达不到电影级别。适合短视频、宣传片等场景。
Q2: 可以商用吗?
A: 花火 Studio本身是MIT License,可以商用。但生成的内容版权取决于你使用的AI服务的条款,请仔细阅读。
Q3: 支持中文吗?
A: 完全支持中文,界面和功能都是中文优先。
Q4: 需要什么配置的电脑?
A: 花火 Studio本身对配置要求不高,普通笔记本即可。但如果你想部署本地AI模型,建议有独立显卡(至少8GB显存)。
Q5: 可以导出什么格式?
A: 目前支持MP4格式,后续会支持更多格式。
Q6: 有没有教程?
A: 项目README里有详细的使用流程,后续会制作视频教程。