Fish Speech V1.5：领先的多语言文本转语音模型

2024-12-06 881 阅读2分钟

Fish Speech V1.5：领先的多语言文本转语音模型

简介

Fish Speech V1.5 是一个基于超过100万小时多种语言音频数据训练的先进文本转语音（TTS）模型。它以其高质量的语音输出和广泛的语言支持而闻名。

支持的语言

Fish Speech V1.5 支持以下语言：

英语（en）：超过300,000小时
中文（zh）：超过300,000小时
日语（ja）：超过100,000小时
德语（de）：约20,000小时
法语（fr）：约20,000小时
西班牙语（es）：约20,000小时
韩语（ko）：约20,000小时
阿拉伯语（ar）：约20,000小时
俄语（ru）：约20,000小时
荷兰语（nl）：少于10,000小时
意大利语（it）：少于10,000小时
波兰语（pl）：少于10,000小时
葡萄牙语（pt）：少于10,000小时

资源链接

Fish Speech 1.5整合包：夸克网盘
项目地址：GitHub - fishaudio/fish-speech
官网：Fish Audio
文档：Fish Speech Documentation
Hugging Face模型：Fish Speech 1.5 on Hugging Face

使用说明

以下是Fish Speech V1.5的简单使用说明：

下载并解压整合包：从夸克网盘下载Fish Speech 1.5整合包，并解压到本地目录。
运行推理页面：解压后，双击“双击我启动.bat”文件。
配置推理服务器：在推理配置中勾选“打开推理服务器”选项。
访问推理界面：推理界面将在http://127.0.0.1:7862上启动，打开浏览器新窗口，访问http://127.0.0.1:7862/。

结语

Fish Speech V1.5以其卓越的性能和广泛的语言支持，为开发者和用户提供了一个强大的文本转语音解决方案。无论是在开发新应用还是提升现有系统的语音交互能力，Fish Speech V1.5都是一个值得考虑的选择。