YumCut:开源免费的 AI 短视频生成器,一句话批量产出 TikTok / 抖音 / YouTube Shorts 视频

78 阅读7分钟

YumCut:开源免费的 AI 短视频生成器,一句话批量产出 TikTok / 抖音 / YouTube Shorts 视频

写一句话创意,AI 帮你搞定脚本、配音、画面、字幕和剪辑——直接发布。

YumCut 是一个开源、可自部署的 AI 短视频生成工具,专为竖屏短视频(9:16)设计。

能自动完成从脚本撰写、场景画面生成、AI 配音、字幕叠加到最终剪辑的全链路视频制作流程输出一条可以直接发布到 TikTok、Instagram Reels 或 YouTube Shorts 的成品视频。

YumCut 把写脚本、找素材、配音、加字幕、剪辑导出这个流程压缩成了:输入一个想法 → 等几分钟 → 拿到成品视频

市面上类似的工具(Clippie AI、FacelessReels、Revid.ai 等)基本都是按月订阅的闭源 SaaS.

而 YumCut 是开源的——你可以自己部署、自己选择 AI 供应商,实际成本可以比这些付费工具便宜 10 倍左右


运行原理

YumCut 的核心是一条自动化视频生产流水线,每个环节由不同的 AI 服务驱动:

输入 PromptAI 生成脚本(拆分场景、写旁白文案)→ AI 生成画面(为每个场景生成匹配的图片/视觉素材)→ AI 语音合成(将旁白文本转为配音音频)→ 自动叠加字幕FFmpeg 合成最终视频(9:16 竖屏格式,带水印可选)

整个过程中,你可以通过模板系统控制视觉风格(比如辛普森卡通风格、恐怖故事风格等),并且支持将同一个创意一键生成多种语言版本。


部署与运行全流程

两种使用方式

在开始之前,你可以:

  • 在线使用(零部署):直接访问 yumcut.com,注册即用,个人免费
  • 自部署(完全掌控):在自己的服务器上运行,适合有技术背景的用户或团队

以下是完整的自部署流程。


环境准备

你需要准备以下基础环境:

  • Node.js:推荐 18+,用于运行 Next.js 应用
  • MySQL 8+:数据库,存储项目和用户数据
  • FFmpeg:视频合成引擎,需要系统全局安装
  • AI 服务的 API Key:根据你选择的图像生成、语音合成等服务商,准备对应的密钥

第一步:克隆项目

git clone https://github.com/IgorShadurin/app.yumcut.com.git
cd app.yumcut.com

第二步:安装依赖

npm install

第三步:创建数据库

安装好 MySQL 8+ 后,创建 YumCut 专用的数据库和用户:

# 创建数据库(支持 emoji 等特殊字符)
mysql -uroot -p -e "CREATE DATABASE IF NOT EXISTS \`yumcut\` CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci;"

# 创建专用数据库用户
mysql -uroot -p -e "CREATE USER 'yumcut'@'%' IDENTIFIED BY '你的强密码'; GRANT ALL PRIVILEGES ON \`yumcut\`.* TO 'yumcut'@'%'; FLUSH PRIVILEGES;"

第四步:配置环境变量

# 复制示例环境文件
cp example.env .env

打开 .env 文件,至少需要配置以下核心项:

# 数据库连接
DATABASE_URL="mysql://yumcut:你的强密码@localhost:3306/yumcut"

# NextAuth 认证密钥(随机长字符串)
NEXTAUTH_SECRET="随机生成一个长字符串"

# API 密码(服务间通信)
SERVICE_API_PASSWORD="你的服务API密码"
DAEMON_API_PASSWORD="你的守护进程API密码"

# 媒体文件存储根目录
MEDIA_ROOT="/path/to/your/media/storage"

根据你使用的 AI 服务商,还需要填入对应的 API Key(如 OpenAI、ElevenLabs 等),具体可参考 example.env 中的注释说明。

第五步:初始化数据库

# 初始化 Prisma
npx prisma init

# 应用数据库迁移(开发环境)
npx prisma migrate dev --name init

# 生产环境则使用:
# npm run prisma:migrate:deploy && npm run prisma:generate

第六步:启动应用

# 开发模式
npm run dev

# 生产模式
npm run build
npm start

启动后访问 http://localhost:3000(默认端口),即可看到 YumCut 的 Web 界面。

第七步:使用示例

我们可以直接访问yumcut.com/进行实验:

  1. 新建一个视频项目
  2. 输入你的创意 Prompt(比如:"讲一个关于比特币起源的 30 秒恐怖故事")
  3. 选择模板风格(辛普森风、恐怖风、极简风等)
  4. 点击生成,等待流水线自动完成
  5. 预览 → 下载 → 发布

我们可以看到,他是先生成了一个text script,然后生成对应的voice,之后依据script,结合参考的tamplate去一帧帧生成图片,然后再把图片拼接在一起。

Data plague erupts!
Byte Vega slams his gauntlet onto the block.
The Genesis Node spits red data-veins through the air.
Crimson torrents coil around a victim's flickering face.
The cursed blockchain consumes nearby memory fragments.
The Node launches jagged code shards.
They crack Byte's teal armor.
Can digital death be permanent?
Red data-veins rip the victim into static.
The wave slams Byte against a sparking wall.
A corrupted vortex drags Byte toward obsidian core.
His torn armor offers no protection.
The Node shatters the floor beneath them.
Reality itself begins to tremble.
Crimson maelstrom tears through the air.
Byte clings to a jagged conduit.
What happens when code corrupts flesh?
The vortex yanks Byte toward the obsidian heart.
The victim's face screams in silent static.
Memory itself threatens to vanish forever.
The core becomes a hungry black maw.
Byte slams his gauntlet into the core.
Teal light floods the chamber.
The victim's face restores to vivid clarity.

音频voice:

然后一帧帧生成图片,这里使用的是qwen的base模型:

最后拼接成一个完整的视频:

整个跑下来大概 5-10 分钟。说实话,连贯性跟 Seedance 2.0 这种模型比还是有差距的,更像是动起来的漫画,效果确实还有待提高。

下一步打算把底模换成 Nano Banana Pro,首尾帧拼接也想上个更强劲的模型,当然,这肯定会烧更多钱。

总的来说,这个开源项目虽然“画质”一般,但胜在白嫖、量大管饱。它的脚本分镜逻辑很值得借鉴,我们可以拿它当“低成本预演机”,先用它跑分镜看效果,等连贯性调顺了再去付费平台出大片,避免反复抽卡浪费钱。


实际效果展示

项目 README 中展示了多个已经发布的真实视频案例:

  • 辛普森风格故事:YouTube Shorts,1.5K 播放
  • 意大利恐怖故事:YouTube Shorts,1.5K 播放
  • 辛普森西班牙语版:YouTube Shorts,1.5K 播放(同一创意多语言输出)
  • 森林 99 夜故事:YouTube Shorts,1.2K 播放
  • 比特币故事:TikTok,90K 播放

这些都是 AI 全自动生成的无脸(Faceless)风格短视频,适合批量矩阵号运营。


普通用户能用来做什么?

📱 短视频创作者 / 自媒体博主

这是 YumCut 最直接的用户群。

如果你在运营 TikTok、YouTube Shorts、Instagram Reels 或者国内的抖音/快手,YumCut 可以帮你把日更从"体力活"变成"动动嘴"。

尤其适合无脸频道(Faceless Channel)——不需要真人出镜,AI 生成全部画面。

🏭 MCN / 短视频代运营团队

需要同时为多个品牌或客户制作内容?YumCut 的批量渲染和模板系统天然适合这种场景。

一个创意,切换模板和语言,快速出多个版本,大幅降低人工成本。

🌍 想做海外市场的团队

YumCut 支持多语言输出——同一套视觉素材,自动切换为英文、西班牙文、日文等不同语言的配音和字幕。

对于想用同一个内容覆盖多国市场的创作者来说,这是巨大的效率提升。

🔧 二次开发者

YumCut 提供了 API hooks 接口,如果你是开发者,可以把它的视频生成能力集成到自己的产品中——比如做一个"AI 营销助手"SaaS,背后调用 YumCut 的流水线来生成视频。


写在最后

短视频已经是当下最重要的内容分发渠道之一,而"量产+测试"是做短视频增长的核心方法论。

YumCut 把这个方法论变成了一个可以自部署的开源工具——输入想法,输出可发布的视频。

对于个人创作者来说,它是免费的生产力加速器;对于团队来说,它是可以深度定制的内容工厂。

如果你不想折腾部署,也可以直接去 yumcut.com 在线用起来。

项目地址github.com/IgorShaduri… 在线版yumcut.com


觉得有用的话,去 GitHub 给个 ⭐ Star 支持一下吧~