离线语音识别Whisper整合包下载及使用教程
本次的离线语音识别安装包基于OpenAI的Whisper是一种基于深度学习的语音识别模型,它是一种通用的语音识别模型,可以用于语音识别、语音翻译和语言识别等任务。
离线安装包
下载地址:xueshu.fun/2787/
安装包内容组成如下图:
其中
-
exe
后缀为启动文件 -
bin
后缀为模型文件,模型文件越大,合成效果越好,速度越慢
使用教程
双击exe打开软件,软件界面如下,操作步骤: 1- 选择模型文件,就是上图中的bin文件 2- 选择是否GPU合成 设置好后,点击OK进入下一步
3- 选择要识别的音频文件 4- 选择输出字幕还是txt文件