KrillinAI,一站式开源视频翻译配音工具,极简部署,支持100种语言

232 阅读6分钟

KrillinAI 是由 Krillin AI 开发的多功能音视频本地化和增强解决方案。这个极简而强大的工具集成了视频翻译、配音和语音克隆,支持横屏和竖屏格式,确保在所有主要平台(Bilibili、小红书、抖音、微信视频、快手、YouTube、TikTok 等)上完美呈现。通过端到端的工作流程,您只需几次点击即可将原材料转化为精美的跨平台内容。

主要特点和功能:

🎯 一键启动:无需复杂的环境配置,自动安装依赖,立即可用,提供新的桌面版本以便于访问!

📥 视频获取:支持 yt-dlp 下载或本地文件上传

📜 准确识别:基于 Whisper 的高精度语音识别

🧠 智能分段:使用 LLM 进行字幕分段和对齐

🔄 术语替换:一键替换专业词汇

🌍 专业翻译:基于上下文的 LLM 翻译,保持自然语义

🎙️ 语音克隆:提供 CosyVoice 中选择的语音音调或自定义语音克隆

🎬 视频合成:自动处理横屏和竖屏视频及字幕布局

💻 跨平台:支持 Windows、Linux、macOS,提供桌面和服务器版本

效果演示

下图展示了在导入一段 46 分钟的本地视频并一键执行后生成的字幕文件效果,无需任何手动调整。没有遗漏或重叠,分段自然,翻译质量非常高。 对齐效果

### 字幕翻译* * * subtitle_translation.mp4 ### 配音* * * tts.mp4 ### 竖屏模式* * * agi.mp4 

🔍 支持的语音识别服务

下表中的所有本地模型支持可执行文件 + 模型文件的自动安装;您只需选择,Klic 将为您准备一切。

服务来源支持的平台模型选项本地/云备注
OpenAI Whisper所有平台-速度快,效果好
FasterWhisperWindows/Linuxtiny/medium/large-v2(推荐 medium+)本地速度更快,无云服务费用
WhisperKitmacOS(仅限 M 系列)large-v2本地针对 Apple 芯片的本地优化
WhisperCpp所有平台large-v2本地支持所有平台
Alibaba Cloud ASR所有平台-避免中国大陆的网络问题

🚀 大语言模型支持

✅ 兼容所有符合 OpenAI API 规范 的云/本地大语言模型服务,包括但不限于:

  • OpenAI
  • Gemini
  • DeepSeek
  • 通义千问
  • 本地部署的开源模型
  • 其他兼容 OpenAI 格式的 API 服务

🎤 TTS 文本转语音支持

  • 阿里云语音服务
  • OpenAI TTS

语言支持

支持的输入语言:中文、英语、日语、德语、土耳其语、韩语、俄语、马来语(持续增加中)

支持的翻译语言:英语、中文、俄语、西班牙语、法语及其他 101 种语言

界面预览

界面预览 界面预览

🚀 快速开始

您可以在 KrillinAI 的 Deepwiki 上提问。它会索引库中的文件,因此您可以快速找到答案。

基本步骤

首先,从 Release 下载与您的设备系统匹配的可执行文件,然后按照下面的教程选择桌面版或非桌面版。将软件下载放在一个空文件夹中,因为运行它会生成一些目录,保持在空文件夹中会使管理更容易。

【如果是桌面版,即带有“desktop”的发布文件,请查看这里】 桌面版是新发布的,旨在解决新用户在正确编辑配置文件时遇到的问题,并且有一些错误正在持续更新。

  1. 双击文件开始使用(桌面版也需要在软件内进行配置)

【如果是非桌面版,即不带“desktop”的发布文件,请查看这里】 非桌面版是初始版本,配置更复杂,但功能稳定,适合服务器部署,因为它以网页格式提供 UI。

  1. 在文件夹内创建一个 config 文件夹,然后在 config 文件夹中创建一个 config.toml 文件。将源代码 config 目录中的 config-example.toml 文件内容复制到 config.toml 中,并根据注释填写您的配置信息。
  2. 双击或在终端中执行可执行文件以启动服务
  3. 打开浏览器并输入 http://127.0.0.1:8888 开始使用(将 8888 替换为您在配置文件中指定的端口)

对于:macOS 用户

【如果是桌面版,即带有“desktop”的发布文件,请查看这里】 由于签名问题,桌面版目前无法双击运行或通过 dmg 安装;您需要手动信任该应用程序。方法如下:

  1. 在可执行文件所在目录打开终端(假设文件名为 KrillinAI_1.0.0_desktop_macOS_arm64)
  2. 按顺序执行以下命令:
sudo xattr -cr ./KrillinAI_1.0.0_desktop_macOS_arm64
sudo chmod +x ./KrillinAI_1.0.0_desktop_macOS_arm64 
./KrillinAI_1.0.0_desktop_macOS_arm64

【如果是非桌面版,即不带“desktop”的发布文件,请查看这里】 该软件未签名,因此在 macOS 上运行时,在完成“基本步骤”中的文件配置后,您还需要手动信任该应用程序。方法如下:

  1. 在可执行文件所在目录打开终端(假设文件名为 KrillinAI_1.0.0_macOS_arm64)

  2. 按顺序执行以下命令:

    sudo xattr -rd com.apple.quarantine ./KrillinAI_1.0.0_macOS_arm64
    sudo chmod +x ./KrillinAI_1.0.0_macOS_arm64
    ./KrillinAI_1.0.0_macOS_arm64
    

    这将启动服务

Docker 部署

该项目支持 Docker 部署;请参阅 Docker 部署说明

根据提供的配置文件,以下是您 README 文件中更新的“配置帮助(必读)”部分:

配置帮助(必读)

配置文件分为几个部分:[app][server][llm][transcribe] 和 [tts]。一个任务由语音识别(transcribe)+ 大模型翻译(llm)+ 可选的语音服务(tts)组成。理解这一点将帮助您更好地掌握配置文件。

最简单和最快的配置:

仅用于字幕翻译:

  • 在 [transcribe] 部分,将 provider.name 设置为 openai
  • 然后,您只需在 [llm] 块中填写您的 OpenAI API 密钥即可开始进行字幕翻译。app.proxymodel 和 openai.base_url 可根据需要填写。

平衡成本、速度和质量(使用本地语音识别):

  • 在 [transcribe] 部分,将 provider.name 设置为 fasterwhisper
  • 将 transcribe.fasterwhisper.model 设置为 large-v2
  • 在 [llm] 块中填写您的大语言模型配置。
  • 所需的本地模型将自动下载和安装。

文本转语音(TTS)配置(可选):

  • TTS 配置是可选的。
  • 首先,在 [tts] 部分设置 provider.name(例如,aliyun 或 openai)。
  • 然后,填写所选提供商的相应配置块。例如,如果选择 aliyun,则必须填写 [tts.aliyun] 部分。
  • 用户界面中的语音代码应根据所选提供商的文档进行选择。
  • 注意:  如果您计划使用语音克隆功能,则必须选择 aliyun 作为 TTS 提供商。

阿里云配置:

  • 有关获取阿里云服务所需的 AccessKeyBucket 和 AppKey 的详细信息,请参阅 阿里云配置说明。重复的 AccessKey 等字段旨在保持清晰的配置结构。

常见问题

请访问 常见问题

贡献指南

  1. 请勿提交无用文件,如 .vscode、.idea 等;请使用 .gitignore 过滤它们。
  2. 请勿提交 config.toml;请提交 config-example.toml。