花火 Studio-基于AI的短剧生产工具我用AI做了一个短剧生产工具，从剧本到视频全自动化,一个基于AI的短剧生产工具

我用AI做了一个短剧生产工具，从剧本到视频全自动化

前言：短剧创作者的痛点

最近在知乎上经常看到有人问："想做短剧/短视频，但不会画画、不会建模、也没有拍摄团队，怎么办？"

作为一个技术宅，我的答案是：用AI啊！

于是我花了一段时间，做了这个工具——花火 Studio（Huahuo Studio），一个基于AI的短剧生产工具，能够帮你从剧本到视频的全流程自动化创作。

今天就来分享一下这个工具，以及我在开发过程中的一些思考。

一、花火 Studio 是什么？

简单来说，花火 Studio 是一个桌面应用，让你用AI生成短剧/短视频。

你只需要：

写好剧本（或者让AI帮你写）

点几下鼠标

等AI干活

导出视频

就这么简单。

核心功能一览

🎬 剧本创作

支持导入和编辑剧本

AI自动解析剧本，提取场景、角色、分镜信息

支持多种剧本格式

👤 角色管理

管理角色信息（姓名、性别、年龄、性格等）

AI生成角色形象（头像、多视角设定图）

AI智能生成角色外貌描述

🏞️ 场景管理

编辑场景信息（地点、时间、氛围等）

AI生成场景参考图

场景与分镜自动关联

📸 分镜制作

从剧本自动生成分镜

编辑分镜画面描述

AI生成分镜参考图

AI生成分镜视频（图生视频）

支持批量生成

🎨 多种视觉风格

动画风格：日式2D动画、3D动画、儿童动画、粘土动画、水彩、像素、素描

真人风格：现代都市、年代剧、奇幻、科幻、纪录片

大师风格：宫崎骏、新海诚、上海美影厂、迪士尼、皮克斯、吉卜力、赛博朋克、黑色电影、韦斯·安德森

📦 渲染与导出

渲染任务队列管理

支持视频导出

二、为什么要做这个工具？

短剧市场火爆，但创作门槛高

最近几年短剧市场爆发式增长，但传统的短剧制作需要：

编剧

导演

演员

摄影师

后期团队

大量资金

对于个人创作者或小团队来说，门槛太高了。

AI技术成熟，但工具分散

现在AI图像生成（Stable Diffusion、Midjourney）、AI视频生成（Runway、Pika）、大语言模型（GPT、Claude）都已经很成熟了。

但问题是：这些工具都是分散的。

你需要：

在ChatGPT里写剧本

在Midjourney里生成角色

在Runway里生成视频

在剪映里剪辑

来回切换，效率低下。

我想要一个一体化的解决方案

所以我做了花火 Studio，把整个流程整合到一个桌面应用里：

剧本 → 角色 → 场景 → 分镜 → 视频 → 导出

全流程自动化，一站式解决。

三、使用流程演示

下面我用一个实际案例来演示一下使用流程。

Step 1: 创建项目

打开花火 Studio，创建一个新项目，比如叫"霸道总裁爱上我"（别笑，这题材真的火）。

Step 2: 导入剧本

写好剧本，或者让AI帮你写。比如：

场景1：公司大厅 - 白天

李雪匆忙跑进公司大厅，手里拿着咖啡。

李雪：糟了，要迟到了！

（李雪撞到了陆晨，咖啡洒在了他的西装上）

陆晨（冷冷地）：你知道这套西装多少钱吗？

李雪（慌张）：对不起对不起！我赔！

场景2：总裁办公室 - 白天

陆晨坐在办公桌前，看着李雪的简历。

陆晨：有意思，居然是新来的实习生。

导入剧本后，点击"AI解析"，花火 Studio会自动：

识别出角色：李雪、陆晨

提取场景：公司大厅、总裁办公室

生成分镜：每个镜头的描述

Step 3: 完善角色

进入"角色管理"页面，可以看到AI已经识别出了李雪和陆晨。

点击"生成角色形象"，AI会根据剧本内容生成角色的外貌描述和参考图。

比如：

李雪：20岁左右，清纯可爱，长发，大眼睛，穿着简单的职业装

陆晨：30岁左右，冷峻帅气，短发，深邃的眼神，穿着高级西装

你可以手动调整描述，然后重新生成，直到满意为止。

Step 4: 完善场景

进入"场景管理"页面，编辑场景信息：

公司大厅：现代化的办公楼大厅，明亮，大理石地面，落地窗

总裁办公室：豪华的办公室，大落地窗，城市景观，黑色办公桌

点击"生成场景图"，AI会生成场景的参考图。

Step 5: 生成分镜

进入"分镜制作"页面，可以看到AI已经自动生成了分镜列表。

每个分镜都有：

场景

角色

动作描述

台词

你可以编辑分镜描述，然后点击"生成分镜图"，AI会生成每个镜头的静态图片。

Step 6: 生成视频

分镜图生成后，点击"生成视频"，AI会基于分镜图生成视频片段（图生视频）。

这一步会比较慢，因为视频生成需要时间。你可以批量提交任务，然后去喝杯咖啡。

Step 7: 导出

所有视频片段生成后，进入"导出"页面，点击"导出视频"，花火 Studio会把所有片段合并成一个完整的视频。

搞定！

四、技术实现

作为一个技术分享，我也简单说说技术栈。

前端技术栈

React 19 + TypeScript：现代化的前端框架

TailwindCSS：快速构建UI

Electron 33：跨平台桌面应用

TanStack Router：类型安全的路由

Zustand：轻量级状态管理

Radix UI：无障碍的UI组件库

后端技术栈

SQLite + Drizzle ORM：本地数据库，存储项目数据

better-sqlite3：高性能的SQLite绑定

AI服务集成

花火 Studio支持多种AI服务：

图像生成

阿里云通义万相

API易（Gemini）

视频生成

阿里云通义万相（图生视频）

API易（Sora/VEO）

大语言模型

OpenAI兼容API

阿里云通义千问

Gemini

你可以根据自己的需求和预算选择不同的服务。

为什么选择桌面应用？

有人可能会问：为什么不做成Web应用？

原因有几个：

数据隐私：剧本、角色、场景都是创作者的核心资产，本地存储更安全

性能：视频处理需要大量计算，桌面应用性能更好

离线使用：除了调用AI API，其他功能都可以离线使用

五、使用成本

很多人关心成本问题。

花火 Studio本身是开源免费的（MIT License），但调用AI服务需要付费。

以阿里云通义万相为例：

图像生成：约0.08元/张

视频生成：约1-2元/秒（5秒视频约5-10元）

一个10分钟的短剧，大概需要：

50-100个分镜

图像生成：50-100张 × 0.08元 = 4-8元

视频生成：50-100个片段 × 5秒 × 1.5元 = 375-750元

总成本约400-800元，相比传统拍摄（几万到几十万），成本大幅降低。

当然，如果你有自己的GPU，也可以部署本地模型（比如Stable Diffusion），成本会更低。

六、适用场景

花火 Studio适合哪些人？

个人创作者

想做短剧/短视频，但没有团队和资金

有创意，但不会画画、不会拍摄

小型工作室

需要快速产出内容

想降低制作成本

教育机构

制作教学视频

学生作品创作

企业宣传

制作产品宣传片

企业文化视频

七、未来规划

花火 Studio目前还是0.1.0版本，还有很多功能在开发中：

短期计划（1-3个月）

[ ] 支持更多AI服务（Midjourney、Runway等）

[ ] 优化视频生成质量

[ ] 添加音频生成（配音、背景音乐）

[ ] 支持字幕自动生成

中期计划（3-6个月）

[ ] 支持多语言（英文、日文等）

[ ] 添加模板库（常见短剧类型）

[ ] 支持团队协作

[ ] 云端同步

长期计划（6-12个月）

[ ] 支持实时预览

[ ] 添加特效库

[ ] 支持3D场景生成

[ ] 移动端应用

八、如何获取？

花火 Studio是开源项目，代码托管在GitHub：

GitHub地址：github.com/luoyedi-pr/…

快速开始

克隆项目

git clone github.com/luoyedi-pr/…

cd huahuo-studio

安装依赖

npm install

启动开发模式

npm run dev

系统要求

Node.js >= 18

Windows / macOS / Linux

首次配置

启动后，进入设置页面配置API：

数据存储路径：设置项目文件保存位置

LLM API：配置大语言模型API（用于剧本解析）

图像API：配置图像生成API（用于生成参考图）

视频API：配置视频生成API（用于图生视频）

九、总结

花火 Studio是我对"AI+内容创作"的一次探索。

我相信，AI不会取代创作者，但会让创作变得更简单。

传统的短剧制作需要大量的人力、物力、财力，但AI可以大幅降低门槛，让更多人能够实现自己的创意。

当然，花火 Studio还有很多不足，比如：

视频质量还不够稳定

生成速度还比较慢

功能还不够完善

但这只是开始。

随着AI技术的发展，我相信未来会有更多更好的工具出现，让内容创作变得像写文章一样简单。

如果你对这个项目感兴趣，欢迎：

⭐ Star项目

🐛 提交Issue

🔧 贡献代码

💬 加入讨论

让我们一起，用AI创造更多精彩的内容！

附录：常见问题

Q1: 生成的视频质量如何？

A: 取决于你使用的AI服务。目前主流的AI视频生成服务（如Runway、Pika、通义万相）质量都不错，但还达不到电影级别。适合短视频、宣传片等场景。

Q2: 可以商用吗？

A: 花火 Studio本身是MIT License，可以商用。但生成的内容版权取决于你使用的AI服务的条款，请仔细阅读。

Q3: 支持中文吗？

A: 完全支持中文，界面和功能都是中文优先。

Q4: 需要什么配置的电脑？

A: 花火 Studio本身对配置要求不高，普通笔记本即可。但如果你想部署本地AI模型，建议有独立显卡（至少8GB显存）。

Q5: 可以导出什么格式？

A: 目前支持MP4格式，后续会支持更多格式。

Q6: 有没有教程？

A: 项目README里有详细的使用流程，后续会制作视频教程。