合成的语音,有些词语听起来有点不顺。
一、本地安装LocalAI
参考之前的文章本地搭建 LocalAI 部署大模型(CPU版本)
这次搭建用的配置
二、下载中文语音基础模型
# 下载中文语音模型
$ wget https://github.com/rhasspy/piper/releases/download/v0.0.2/voice-zh_CN-huayan-medium.tar.gz -O /opt/websrv/program/LocalAI/models/
# 解压模型压缩包,将模型文件和json移动到LocalAI的项目models目录下,MODEL_CARD这个文件不需要
$ tar xzvf voice-zh_CN-huayan-medium.tar.gz
$ mv zh_CN-huayan-medium* ./
检查中文语音模型是否加载成功
curl --location --request GET 'http://你的域名/v1/models' \
--header 'Content-Type: application/json'
三、配置
.env 文件修改:
GO_TAGS=tts
三、重启容器
docker compose restart
四、测试文本生成语音是否ok
备注:windows 不支持单引号,要处理一下curl命令:先转义双引号,然后把单引号改为双引号(其他curl也类似处理)。Linux不需要单引号改为双引号。
curl http://你的域名/tts -H "Content-Type: application/json" -d "{\"model\":\"zh_CN-huayan-medium.onnx\",\"input\": \"此外,有一则网传视频显示,狗粮快递纸箱破损严重,且狗粮包装上出现不明孔洞,称是有人专门去快递站往狗粮快递中注射毒狗药,视频引发网友关注。更有网传截图称“有派出所接到报警有人在网上买的狗粮被人注射敌敌畏,现已立案侦查”,附上的视频也为上述视频。\"}" --output test.mp3