音频分离

276 阅读1分钟

概述

一种是不同类型声音分离,比如音乐和人声。

一种是语音增强和降噪。语音增强的常见算法有基于谱相减的语音增强算法、基于小波分析的语音增强算法、基于卡尔曼滤波的语音增强算法、基于信号子空间的增强方法、基于听觉掩蔽效应的语音增强方法、基于独立分量分析的语音增强方法、基于神经网络的语音增强方法。

名词

  • 频谱泄漏
  • 加窗
  • 窗函数

模型和算法

  • NMF即Nonnegative Matrix Factorization,非负矩阵分解
  • GMM,高斯混合模型
  • EM即Expectation Maximization,期望最大化算法
  • ML算法,即Maximum Likehood,极大似然估计
  • MFCC(Mel-scaleFrequency Cepstral Coefficients),梅尔倒谱系数

开源项目

参考文档

1).高斯混合模型详解