开源·免费·低延迟·高音质|手把手教你用 w-okada 调试RVC变声器

51 阅读3分钟

一、w-okada介绍

w-okada/voice-changer 是 RVC 生态中的一个 GUI 封装实现,目标是简化部署流程并支持实时推理。与其他“换皮”RVC 工具(如某些国内打包版)相比,它的优势在于:

代码公开,更新频繁;

支持多种后端(CUDA / ROCm / CPU);

提供 HTTP API,便于集成;

无捆绑、无广告、无用户追踪。

不过,它依然受限于 RVC 本身的技术特性:对训练数据依赖强,跨语种效果不稳定,且实时性高度依赖 GPU 性能。对于普通用户,仍需手动配置虚拟音频路由,有一定学习门槛。

二、开始前,请先准备好以下内容

安装 VoiceMeeter 虚拟音频混音器

这是让变声声音被其他软件“听到”的关键。我们使用 VoiceMeeter Banana 版本,它免费、稳定,且与 w-okada 兼容良好。

你可以直接从项目页面下载安装包:mxgf.cc/w-okada/

安装过程一路默认即可,完成后建议重启电脑。成功安装后,在 Windows 声音设置中应能看到名为 “VoiceMeeter Input” 和 “VoiceMeeter Output” 的设备。

下载 w-okada 离线整合包

为了简化流程,我们提供了一个包含主程序和常用 RVC 模型的整合压缩包。这意味着你不需要再单独寻找或配置模型文件,解压后双击启动脚本就能开始使用。

整合包同样在此页面获取:mxgf.cc/w-okada/

变声器配置教程

第一步:启动 w-okada 主程序

进入解压后的文件夹,双击运行 start_http.bat(Windows 用户)。

首次启动时,程序会:

自动安装或加载内置的 Python 虚拟环境;

初始化 RVC 模型推理后端(可能需要 1–3 分钟);

自动弹出一个独立的桌面 GUI 窗口(不是浏览器标签页),界面包含 “Settings”、“Model”、“Audio Devices” 等选项卡。

第二步:配置音频输入与输出设备
界面讲解

在弹出的 GUI 界面 中,我们看看有那些内容,首先第一栏是模型角色信息,可以自己导入RVC音色模型,当然w-okada也内置了一些音色模型,如果想要下载更多RVC模型,专业变声器音色模型,可以访问模型工坊下载,百款RVC音色模型,也有专门的变声陪玩和热门动漫游戏音色模型。mxgf.cc 模型工坊 mxgf.cc。

第二栏为角色转换信息,如果转换女性音色 音高为6

第三栏最为重要,是变声器通道信息,设置变声器的输入麦克风,输出虚拟声卡的重要的一环。

RVC模型工坊 mxgf.cc

RVC模型工坊 mxgf.cc

点击编辑,可以上传本地的模型和对应人物图片,模型以PTH结尾的RVC模型

启用实时变声

回到 w-okada 的 GUI 界面,点击顶部 “Start” 按钮

此时:

w-okada 从麦克风采集音频;

经 RVC 模型实时变声;

将结果输出到 VoiceMeeter Input

所有监听 VoiceMeeter Output 的软件(如 Discord、OBS)将收到变声后的声音。

🔁 重要逻辑:w-okada 的输出 = VoiceMeeter 的输入 → VoiceMeeter 的输出 = 其他软件的“麦克风”