OpenVoice:无需训练的快速语音克隆整合包

958 阅读1分钟

OpenVoice:无需训练的快速语音克隆整合包

OpenVoice,一种多功能的即时语音克隆方法,只需要参考说话者的一小段音频剪辑即可复制他们的声音并生成多种语言的语音。OpenVoice 支持对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调,以及复制参考扬声器的音调颜色。OpenVoice 还实现了零样本跨语言语音克隆,适用于未包含在大规模说话人训练集中的语言。

OpenVoice能对声音风格的精细控制,包括情感、口音、节奏、停顿和语调,同时能够复制参考发言者的音色。 主要功能:

  • 准确的音色克隆:OpenVoice能够精确地克隆参考音色,并在多种语言和口音中生成语音。

  • 灵活的声音风格控制:用户可以控制生成语音的情感和口音,以及其他风格参数,如节奏、停顿和语调。

  • 零样本跨语言声音克隆:OpenVoice可以在未包含在大规模多语言训练集中的任何语言之间进行声音克隆。

学术Fun将上述工具制作成一键启动包,点击即可使用,避免大家配置Python环境出现各种问题,下载地址: xueshu.fun/3574/在此页面右侧区域点击下载!

注意电脑配置如下

  • windows 10/11

  • 6G显存以上英伟达显卡

下载使用教程