KrillinAI 是由 Krillin AI 开发的多功能音视频本地化和增强解决方案。这个极简而强大的工具集成了视频翻译、配音和语音克隆,支持横屏和竖屏格式,确保在所有主要平台(Bilibili、小红书、抖音、微信视频、快手、YouTube、TikTok 等)上完美呈现。通过端到端的工作流程,您只需几次点击即可将原材料转化为精美的跨平台内容。
主要特点和功能:
🎯 一键启动:无需复杂的环境配置,自动安装依赖,立即可用,提供新的桌面版本以便于访问!
📥 视频获取:支持 yt-dlp 下载或本地文件上传
📜 准确识别:基于 Whisper 的高精度语音识别
🧠 智能分段:使用 LLM 进行字幕分段和对齐
🔄 术语替换:一键替换专业词汇
🌍 专业翻译:基于上下文的 LLM 翻译,保持自然语义
🎙️ 语音克隆:提供 CosyVoice 中选择的语音音调或自定义语音克隆
🎬 视频合成:自动处理横屏和竖屏视频及字幕布局
💻 跨平台:支持 Windows、Linux、macOS,提供桌面和服务器版本
效果演示
下图展示了在导入一段 46 分钟的本地视频并一键执行后生成的字幕文件效果,无需任何手动调整。没有遗漏或重叠,分段自然,翻译质量非常高。
| ### 字幕翻译* * * subtitle_translation.mp4 | ### 配音* * * tts.mp4 | ### 竖屏模式* * * agi.mp4 |
|---|
🔍 支持的语音识别服务
下表中的所有本地模型支持可执行文件 + 模型文件的自动安装;您只需选择,Klic 将为您准备一切。
| 服务来源 | 支持的平台 | 模型选项 | 本地/云 | 备注 |
|---|---|---|---|---|
| OpenAI Whisper | 所有平台 | - | 云 | 速度快,效果好 |
| FasterWhisper | Windows/Linux | tiny/medium/large-v2(推荐 medium+) | 本地 | 速度更快,无云服务费用 |
| WhisperKit | macOS(仅限 M 系列) | large-v2 | 本地 | 针对 Apple 芯片的本地优化 |
| WhisperCpp | 所有平台 | large-v2 | 本地 | 支持所有平台 |
| Alibaba Cloud ASR | 所有平台 | - | 云 | 避免中国大陆的网络问题 |
🚀 大语言模型支持
✅ 兼容所有符合 OpenAI API 规范 的云/本地大语言模型服务,包括但不限于:
- OpenAI
- Gemini
- DeepSeek
- 通义千问
- 本地部署的开源模型
- 其他兼容 OpenAI 格式的 API 服务
🎤 TTS 文本转语音支持
- 阿里云语音服务
- OpenAI TTS
语言支持
支持的输入语言:中文、英语、日语、德语、土耳其语、韩语、俄语、马来语(持续增加中)
支持的翻译语言:英语、中文、俄语、西班牙语、法语及其他 101 种语言
界面预览
🚀 快速开始
您可以在 KrillinAI 的 Deepwiki 上提问。它会索引库中的文件,因此您可以快速找到答案。
基本步骤
首先,从 Release 下载与您的设备系统匹配的可执行文件,然后按照下面的教程选择桌面版或非桌面版。将软件下载放在一个空文件夹中,因为运行它会生成一些目录,保持在空文件夹中会使管理更容易。
【如果是桌面版,即带有“desktop”的发布文件,请查看这里】 桌面版是新发布的,旨在解决新用户在正确编辑配置文件时遇到的问题,并且有一些错误正在持续更新。
- 双击文件开始使用(桌面版也需要在软件内进行配置)
【如果是非桌面版,即不带“desktop”的发布文件,请查看这里】 非桌面版是初始版本,配置更复杂,但功能稳定,适合服务器部署,因为它以网页格式提供 UI。
- 在文件夹内创建一个
config文件夹,然后在config文件夹中创建一个config.toml文件。将源代码config目录中的config-example.toml文件内容复制到config.toml中,并根据注释填写您的配置信息。 - 双击或在终端中执行可执行文件以启动服务
- 打开浏览器并输入
http://127.0.0.1:8888开始使用(将 8888 替换为您在配置文件中指定的端口)
对于:macOS 用户
【如果是桌面版,即带有“desktop”的发布文件,请查看这里】 由于签名问题,桌面版目前无法双击运行或通过 dmg 安装;您需要手动信任该应用程序。方法如下:
- 在可执行文件所在目录打开终端(假设文件名为 KrillinAI_1.0.0_desktop_macOS_arm64)
- 按顺序执行以下命令:
sudo xattr -cr ./KrillinAI_1.0.0_desktop_macOS_arm64
sudo chmod +x ./KrillinAI_1.0.0_desktop_macOS_arm64
./KrillinAI_1.0.0_desktop_macOS_arm64
【如果是非桌面版,即不带“desktop”的发布文件,请查看这里】 该软件未签名,因此在 macOS 上运行时,在完成“基本步骤”中的文件配置后,您还需要手动信任该应用程序。方法如下:
-
在可执行文件所在目录打开终端(假设文件名为 KrillinAI_1.0.0_macOS_arm64)
-
按顺序执行以下命令:
sudo xattr -rd com.apple.quarantine ./KrillinAI_1.0.0_macOS_arm64 sudo chmod +x ./KrillinAI_1.0.0_macOS_arm64 ./KrillinAI_1.0.0_macOS_arm64这将启动服务
Docker 部署
该项目支持 Docker 部署;请参阅 Docker 部署说明
根据提供的配置文件,以下是您 README 文件中更新的“配置帮助(必读)”部分:
配置帮助(必读)
配置文件分为几个部分:[app]、[server]、[llm]、[transcribe] 和 [tts]。一个任务由语音识别(transcribe)+ 大模型翻译(llm)+ 可选的语音服务(tts)组成。理解这一点将帮助您更好地掌握配置文件。
最简单和最快的配置:
仅用于字幕翻译:
- 在
[transcribe]部分,将provider.name设置为openai。 - 然后,您只需在
[llm]块中填写您的 OpenAI API 密钥即可开始进行字幕翻译。app.proxy、model和openai.base_url可根据需要填写。
平衡成本、速度和质量(使用本地语音识别):
- 在
[transcribe]部分,将provider.name设置为fasterwhisper。 - 将
transcribe.fasterwhisper.model设置为large-v2。 - 在
[llm]块中填写您的大语言模型配置。 - 所需的本地模型将自动下载和安装。
文本转语音(TTS)配置(可选):
- TTS 配置是可选的。
- 首先,在
[tts]部分设置provider.name(例如,aliyun或openai)。 - 然后,填写所选提供商的相应配置块。例如,如果选择
aliyun,则必须填写[tts.aliyun]部分。 - 用户界面中的语音代码应根据所选提供商的文档进行选择。
- 注意: 如果您计划使用语音克隆功能,则必须选择
aliyun作为 TTS 提供商。
阿里云配置:
- 有关获取阿里云服务所需的
AccessKey、Bucket和AppKey的详细信息,请参阅 阿里云配置说明。重复的 AccessKey 等字段旨在保持清晰的配置结构。
常见问题
请访问 常见问题
贡献指南
- 请勿提交无用文件,如 .vscode、.idea 等;请使用 .gitignore 过滤它们。
- 请勿提交 config.toml;请提交 config-example.toml。