人工智能:文本转语音

260 阅读1分钟

目标:通过AI平台实现文本转语音功能

一、AI平台

link.juejin.cn/?target=htt…

1.注册账号,需要实名认证

image.png

2.搜索语音合成

点击立即使用

image.png

3.创建应用

a. image.png

image.png

b. image.png

image.png

image.png

image.png

image.png

黄框部分id要复制到下面python代码对应位置

二、python代码

打开VS code终端 下载依赖包

pip install baidu-aip
from aip import AipSpeech

# 应用ID
APP_ID = 'xxxxxxx'
# 应用密钥
API_KEY = 'xxxxxxxxxx'
# 安全密钥
SECRET_KEY = 'xxxxxxxxxxxxxxxxxxx'
# 创建语音识别客户端
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
# 设置语音文本 也可以从本地文件读取
Text = '泻水置平地,各自东西南北流,人生亦有命,安能行叹复坐愁。'
# 设置合成语音的存储路径
filePath = 'D:\1111.mp3'
# 调用客户端方法进行语音生成
result = client.synthesis(Text, 'zh', 1, {
    'vol': 6,  # 合成音频文件的准音量
    'pit': 8,  # 设置语音的音调 取值为0~9 默认为5
    'per': 0,  # 发音人类型 0 女生 1 男生 3 情感合成-度逍遥 4 情感合成-度丫丫,默认为 0 女生,具体的参考官方文档介绍
})
# 判断是否调用成功
if not isinstance(result, dict):
    # 如果调用的成功的话 保存合成的语音文件
    with open(filePath, 'wb') as f:
        f.write(result)

报错:ModuleNotFoundError: No module named 'chardet'

解决方案;在终端输入以下代码

pip install chardet

重新运行就能在D盘找到对应MP3文件了