funasr-语音模型本地部署

0 阅读2分钟

一、 Python 环境准备

本项目的运行依赖于 Python 环境。推荐使用 Python 3.11.9 版本(这里python版本不一致,也没关系,后面使用conda虚拟环境的时候,指定python版本正确即可)进行部署,以确保最佳的兼容性。 python下载地址

执行 python --version,如果出来版本号,就说明安装成功。 image.png

二、 conda 环境准备

Conda是一个强大的开源包管理和环境管理工具,主要用于Python数据科学 、机器学习等领域。它可以帮助用户轻松管理不同的Python版本、安装各种科学计算包(如NumPy、Pandas、TensorFlow等),并创建隔离的虚拟环境,避免包版本冲突。

Conda的核心是包管理器,而Anaconda是包含大量预装包的完整发行版,Miniconda则是轻量版,只包含conda和Python本身。

在Windows 系统下安装Conda,通常推荐使用Miniconda,因为它安装包小(约400-500MB),下载和安装更快,且占用磁盘空间少(安装后约1GB)。

Conda下载地址

执行 conda --version,如果出来版本号,就说明安装成功。

image.png

三、 项目源码获取

获取项目运行所需的代码包,并将压缩包直接解压至本地工作目录中。

四、 虚拟环境配置

为了隔离项目依赖并避免包冲突,建议为该项目创建独立的虚拟环境。

Windows 环境操作步骤:

  1. 切换目录:打开命令行,进入代码解压后的实际目录。

    cd C:\Code\Fun-ASR
    
  2. 创建环境:执行命令创建名为 myenv 的虚拟环境。

    conda create -n myenv python=3.11.9
    
  3. 激活环境:激活虚拟环境。

    conda activate myenv
    

四、 核心依赖安装

在激活的虚拟环境中,按照以下顺序安装项目所需的软件包。

4.1 设置镜像源

由于官方 PyTorch 与 Pip 源在国内访问速度可能受限,建议配置清华大学镜像源以加速下载。

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

4.2 安装 PyTorch

PyTorch 是本项目核心的深度学习框架,请根据硬件情况选择对应的安装指令:

  • NVIDIA GPU(CUDA 12.8)
    pip install torch==2.8.0 torchaudio==2.8.0 --index-url https://download.pytorch.org/whl/cu128
    
  • Mac 或 仅 CPU 运行
    pip install torch==2.8.0 torchaudio==2.8.0 --index-url https://download.pytorch.org/whl/cpu
    

4.3 安装功能组件

安装语音识别所需的核心库与 Web 界面组件:

pip install "transformers==4.57.3" "funasr==1.2.9" "gradio==6.2.0" "modelscope==1.33.0"

五、下载模型权重

modelscope download --model FunAudioLLM/Fun-ASR-MLT-Nano-2512 --local_dir ./checkpoints/Fun-ASR-MLT-Nano-2512

如果有如下报错:

image.png

在当前的虚拟环境(myenv)中执行降级命令:

python -m pip install "setuptools<82.0.0" --force-reinstall

六、启动页面

python webui_futureai.py

在浏览器中打开 http://127.0.0.1:7860/

image.png