RVC:一款高质量AI变声器,支持声音克隆、直播变声、一键运行

1,433 阅读10分钟

RVC:一款高质量AI变声器,支持声音克隆、直播变声、一键运行

RVC全称Retrieval based Voice Conversion(检索式声音转换),一款高质量AI实时直播变声器,支持声音克隆,训练专属声音。基于VITS语音合成系统,能够实现实时声音变换,适用于直播、视频录制等多种场景。

功能特性

  • 使用top1检索替换输入源特征为训练集特征来杜绝音色泄漏
  • 即便在相对较差的显卡上也能快速训练
  • 使用少量数据进行训练也能得到较好结果(推荐至少收集10分钟低底噪语音数据)
  • 可以通过模型融合来改变音色(借助ckpt处理选项卡中的ckpt-merge)
  • 简单易用的网页界面
  • 可调用UVR5模型来快速分离人声和伴奏
  • 使用最先进的人声音高提取算法InterSpeech2023-RMVPE根绝哑音问题,效果更好,运行更快,资源占用更少

如何下载资源?

1:下载压缩包 首先,您需要从以下链接下载一键启动包:

2:启动程序

下载完成后,解压压缩包,点击"运行程序"

3:界面操作

选择正确路径的pth文件和index文件pth为音色文件(主要文件),index为索引文件,没有index就随便选一个后面index rate拉到0就行了,路径内不能含有中文名。

音频设备选择

启动变声

这里有什么?

1、AI工具集合

您可以轻松找到全球最新热门Al工具,为了方便使用,AI科技智库团队精心制作了AI工具整合包,您可以下载并在Windows系统私有化本地化运行,包括图片、文本、视频、音频等工具资源,我们按照功能、业务和行业来分类,尽可能帮助大家找到自己想要的AI工具。

1.1 AI图片工具

MoneyPrinter:一键生成短视频,AI本地整合包

AniPortrait:音频驱动逼真人像合成,腾讯AI数字人整合包

ComfyUI 秋叶整合包:工作流界面,解压即用,快速入门AI绘画

Stable Diffusion 秋叶整合包v4.7 :解压即用,快速入门AI绘画

MuseV : 数字虚拟人视频生成AI工具,一键整合包,开箱即用

DiffSynth Studio:专业视频风格转绘/换衣,最佳DomoAI本地平替,本地整合包

FRESCO – 一键视频风格转换AI工具,告别复杂工作流,本地整合包

AnyDoor:服装替换,一键换装,向场景中无缝传送物体的AI工具整合包

Lama Cleaner:一键去水印,修复老照片神器,去背景AI工具,本地整合包

FaceFusion :最强AI换脸工具,去遮挡,高清化卡通脸一键替换,本地部署包!

Waifu2x Extension GUI :开源图片视频GIF无损放大AI神器,AI工具本地整合包

v2vt:视频自动翻译AI工具,HeyGen最佳平替,本地整合包

ROPE:强大的AI一键换脸整合包,消除脸部遮挡

Stable Diffusion + ReActor AI换脸插件一键整合包

Vid2Densepose + MagicAnimate 一张照片就能生成跳舞视频,AI工具离线整合包

Stable Diffusion OpenVINO整合包 轻薄本CPU24秒出图!

Upscayl:顶级AI智能图片放大工具,最高放大图片16倍

Osprey:像素级别的区域图像分析多模态AI工具,本地整合包

Image to Line Drawings素描神器:图片一键转素描AI工具,本地整合包

BRIA-RMBG:顶级商业图片背景去除整合包

PhotoMaker:最新AI风格写真神器,AI工具本地整合包

InstantID:单图秒生成全套风格写真AI工具,本地整合包

FaceChain:AI数字人及写真整合包

TripoSR :快速单图生成3D模型AI工具,1秒完成,无需GPU,本地整合包

Oms-Diffusion:一键虚拟换装神器,AI工具整合包

Stable Diffusion WebUI Forge 超快SD整合包

DDColor:阿里AI老照片修复神器,AI工具本地整合包

SDXL-Lightning:最快文生图AI工具,本地整合包

DiffBIR:最强AI照片修复神器,AI工具整合包

Rembg:批量抠图AI工具,本地整合包

1.2 AI文本工具

Llama3 :本地运行最强开源大模型整合包

RWKV大模型:本地运行整合包,支持N、A、I卡和CPU!

零一万物34B超大模型,本地部署包,李开复最强开源项目

英特尔大型语言模型整合包,酷睿轻薄本CPU运行

ChatGPT-Prompt:提示词自动生成器离线整合包

通义千问0.5B模型 Langchain-Chatchat本地整合包

Gemma:谷歌开源大模型,抢先使用

1.3 AI视频工具

Facefusion:一键换脸,最强换脸AI数字人工具整合包

DynamiCrafter – 图片转动画视频AI工具,腾讯出品

MuseTalk:实时高质量唇形同步,AI数字人整合包

SyncTalk:超逼真AI数字人本地运行整合包

FRESCO – 一键视频风格转换AI工具,告别复杂工作流,本地整合包

ProPainter :专业视频修复,去水印AI工具,抹除视频中静态水印

ROPE:强大的AI一键换脸整合包,消除脸部遮挡

LaVie:高质量文生视频AI工具,本地整合包

FaceChain:AI数字人及写真整合包

Sora开源平替 Stable Video Diffusion,AI视频生成工具本地整合包

1.4 AI音频工具

GPT SoVITS : 声音AI克隆工具,完美复刻任何角色的语音、语调!

OpenVoice:快速语音克隆整合包,AI工具,一键使用

EmotiVoice : 多音色语音合成神器,文本转语音情绪控制AI工具,本地整合包

AI人声伴奏分离软件UVR5下载及使用教程

Whisper-WebUI:音视频字幕AI生成翻译整合包

SOME:唱歌音频到MIDI的 一键转换AI工具整合包

MAGNet:Meta文本音乐AI生成工具,本地整合包,吉他摇滚、电子音乐都能搞定

2、AI学习资源

AI科技智库还提供了很多Al资料和课程,包括AI面试资料、AI系统产品原型、AI产品经理视频教程,无论你是开发者还是产品经理,都可以在这里找到适合您的资源。相信每个人都可以开启自己的Al学习之旅。

Sora学习资料最全合集(1.92G)

ChatGPT从入门到精通:PPT教程讲义

AIGC精选行业报告

Midjourney进阶及实战教程(6.85G)

人工智能应用百科-2024视频课程(153课程)

吴恩达最新课程《LangChain: Chat with Your Data》

2024大模型(LLMs)算法面试资料,NLP算法,清华校友整理

2024 AI产品经理面试题库,AI产品面试必看

AI产品经理入门资料(376篇)

AI-Ops智能数据分析运维平台

AI大模型聊天助手CHAT-APP