前端在本地实现流式语音识别

581 阅读1分钟

前端在本地实现流式语音识别工具

不依赖服务端,中文识别效果还不错

识别依赖

基于vosk实现
vosk-browser npm包 ,识别过程由安装包提供的wasm资源完成

vosk识别模型下载

alphacephei.com/vosk/models
注意,这里的模型并不能直接在端内使用,建议在官方demo中获取可使用的链接。比如,中文模型的链接位于是https://ccoreilly.github.io/vosk-browser/models/vosk-model-small-cn-0.3.tar.gz.供web使用的模型位于https://github.com/ccoreilly/vosk-browser/tree/master/examples/react/public/models

注意,npm依赖中,要用的是vosk-browser,其他的是通过搭建vosk识别nodejs服务器的资源

image.png

官方demo

vosk官方demo
vosk官方demo git地址

image.png