离线语音识别Whisper整合包下载及使用教程

1,644 阅读1分钟

离线语音识别Whisper整合包下载及使用教程

本次的离线语音识别安装包基于OpenAI的Whisper是一种基于深度学习的语音识别模型,它是一种通用的语音识别模型,可以用于语音识别、语音翻译和语言识别等任务。

离线安装包

下载地址:xueshu.fun/2787/

安装包内容组成如下图:

其中

  • exe后缀为启动文件

  • bin后缀为模型文件,模型文件越大,合成效果越好,速度越慢

使用教程

双击exe打开软件,软件界面如下,操作步骤: 1- 选择模型文件,就是上图中的bin文件 2- 选择是否GPU合成 设置好后,点击OK进入下一步

3- 选择要识别的音频文件 4- 选择输出字幕还是txt文件