AI声音克隆迎来了全新突破,海螺AI的海外版上线了超强的音频模块。
支持声音克隆、文本转语音(TTS)功能。
中文声音克隆效果超级好,且情绪控制也拉满了。
用仅需 10到60秒的音频样本,便能轻松复刻任何人的声音。
目前还****免费开放使用,真的得试一试了。
都知道海螺AI视频生成模型做的牛,没想到在AI声音克隆领域也下了一番苦功夫。
虽然海螺AI起初上线的是问答模块,尽管反响一般。可AI视频和AI声音克隆是目前AI行业中炙手可热的领域,他们都做起来了,有了成果,就值得所有人点个赞。
先说一说海螺AI声音克隆的功能亮点都有哪些吧。
功能亮点
🌟 极低门槛:10到60秒复刻专属声音
仅需录制少量音频样本,海螺AI即可完美复刻声音细节,打破传统语音克隆的复杂流程。
🎤 支持12种语言 + 多情绪表达
多语言覆盖: 支持 中文、粤语、英语、韩语、日语、印尼语、西语、葡语、法语、意大利语、俄语、德语 12种语言,让你的声音拥有更多国际化表达。
情绪选择: 目前提供了 6 种情绪控制(开心、生气、悲伤、惊讶、恐惧、厌恶),轻松适配不同场景说话。
💻 免费创建专属声音模型
灵活使用,简单易用: 每位用户可创建 3 个声音模型,无需额外付费。
快速上手:如何复刻声音?
首先打开海螺AI 音频模块的地址:
海螺AI的Audio模块就在最左边的Tab页,也可以看到目前是Beta试用版,优化提升的空间也是很大。
侧边栏有两个标签,一个是 Text to Speech,也就是文本转语音(TTS),克隆完成的声音模型就在这里使用。
第二个标签叫做 Voices,声音克隆及内置的多语言的声音模型库都在这里。
其实我剪视频一直有一个痛点,没有一个好的可以做旁白的配音,主流的都收费,要么有限制。
刚好海螺AI给了这个机会,去抖音上找了一个漫画解说的视频,从中提取了30s左右的音频来试试。
首先进入到 Voices 页面,点击最上方的“Create your Voice Clone”创建你的语音克隆模型,提供了每个账号3次声音克隆机会。
声音克隆需要以下3个步骤:
step01:给你的声音取个名。
step02:上传音频资源或直接录音。音频需要至少10s的资源,一般推荐30s左右的音频资源,训练效果会更好。最长不超过1分钟。
如果你的音频素材是去噪去背景音后的纯音,可以不勾选下面的去噪选项。否则需要勾选上进行去背景音。
step03:选择声音原声的语言,是中文还是英文等,这样系统才会精准匹配,最终的克隆效果会更好。
一些准备就绪后,就可以点击Convert,开始克隆了。
我嘀个乖乖,这不到10秒钟就克隆完成了,也太迅速了。
克隆完声音,我们就可以使用它了。我们打开Text to Speech页面,在网上拷贝了一小段解说词,不用担心字符过长,海螺AI的TTS可是直接支持万字长文直接转语音。
接下来,切换声音模型,为我们刚刚克隆完成的「Favor解说旁白」。
最后点击「Generate Speech」生成即可。
生成速度还是挺快的,不到半分钟,一些来试听下。 (音频无法上传,可阅读原文)
简直完美了,想做解说配音的同学,不用在到处找云希解说员了。
当然了,也可以设置情绪参数(默认自动)以及语速,特别适合需要情绪饱满的台词或诗作,甚至吵架这种生气的场景也可以自行调节。
当然了,这个克隆的声音模型如果以后能够支持下载到本地,那就非常舒服了。
使用场景
-
创作者的配音利器:为短视频、播客或内容创作赋予独特声音标识,让你的作品更具吸引力。
-
虚拟角色配音:为游戏角色或虚拟偶像提供个性化声音,增强互动性和趣味性。
-
跨语言语音转化:使用多语言支持,将声音无缝转化为不同语言,轻松应对国际市场需求。
-
个性化语音助手:让你的语音助手具备“自己”的声音,实现更个性化的用户体验。
海螺AI 声音克隆对比
功能 | 海螺AI | 其他工具 |
---|---|---|
音频样本需求 | 10到60秒 | 通常需要更长录音时间 |
语言支持 | 12种语言 | 支持语言数量有限 |
情绪选择 | 支持多种情绪表达 | 通常不支持情绪选项 |
操作难度 | 简单直观,零门槛 | 操作复杂,需技术支持 |
费用 | 免费使用 | 部分功能需额外付费 |
写在最后
海螺AI声音克隆功能,将语音克隆的效率和便利性提升到了新高度。
它有着快速高效、多语言支持、丰富情绪调节等特点,是一款不可多得的语音克隆神器。
最主要的是免费,可自己克隆3次声音模型,然后TTS支持万字长文,关键效果还好,国产AI越来越有面了,给力。