语音前端信号处理 - Carrol302的收藏集 - 掘金

语音前端信号处理

ASR之前的语音信号处理，致力于恢复干净语音。

更多收藏集

10篇文章 · 0订阅

语音识别与合成：技术进展与实践

1.背景介绍语音识别和语音合成是人工智能领域中的两个重要技术，它们在现代科技产业中发挥着越来越重要的作用。语音识别技术可以将人类的语音信号转换为文本，从而实现人机交互，而语音合成技术则可以将文本转换

OpenChat
2年前
249
点赞
评论

深度学习与语音识别：技术进展与实践

1.背景介绍语音识别，也被称为语音转换（Speech Recognition），是人工智能领域的一个重要研究方向。它旨在将人类语音信号转换为文本信息，从而实现人机交互、语音搜索、语音对话系统等应用。

OpenChat
2年前
137
点赞
评论

WebRTC 简单入门与实践

本篇文章以 0 经验音视频开发者视角，类比常用的 Web 技术，期望帮助您简单入门 WebRTC 技术！

ZEGO即构
4年前
16k
49
2

🦖不是DINOSAUR是DINOISER：通过噪声表影响条件序列扩散模型效果

写作动机这个工作开篇可以看到是在Diffusion-LM的基础上展开叙述的。因为扩散模型作为新的生成模型在连续域数据上已经取得了比较好的效果，优于其出色的成圣多样性和可控性，因此研究人员可考虑用扩

Ann_
2年前
2.1k
1
评论

🦖不是DINOSAUR是DINOISER：通过噪声表影响条件序列扩散模型效果

webrtc4-噪声消除

具体去噪原理可以参考webrtc源码。 webrtc默认接口都是只支持输入10ms的采样数据，并且只支持8000，16000，32000的采样率，非上述类型采样率，需要重采样后才能进行处理。最新61版本，去噪模块支持输入32k的采样率，但采样个数为160，与上述不符合，需要进…

cclk1024
5年前
656
1
评论

webrtc3-回声消除

从通讯回音产生的原因看，可以分为声学回音（Acoustic Echo）和线路回音（Line Echo），相应的回声消除技术就叫声学回声消除（Acoustic Echo Cancellation，AEC）和线路回声消除（Line Echo Cancellation, LEC）。 …

cclk1024
5年前
2.7k
3
评论

前端音视频WebRTC实时通讯的核心

通过上两个系列专栏的学习，我们对前端音视频及 WebRTC 有了初步的了解，是时候敲代码实现一个 Demo 来真实感受下 WebRTC 实时通讯的魅力了。还没有看过的同学请移步： RTCPeerConnection 类是在浏览器下使用 WebRTC 实现实时互动音视频系统中最核…

童欧巴
5年前
13k
192
31

前端音视频WebRTC实时通讯的核心

前端音视频的那些名词

代表每秒传送的比特数。比特率又称为“二进制位速率”，俗称“码率”，“码流”，又称为数据信号速率。这大兄弟别名好多。。从传输速度的发展看来，摩尔定律不仅应用在晶体管的密度，同样可以用在传输速度：比特率大概每18个月提高一倍。比特率越高，代表单位时间传送的数据就越多。举个例…

童欧巴
5年前
6.1k
91
4

实时通信服务中的语音解混响算法实践

本文讲解了网易云信在语音解混响以及提升通信效果方面的一些研发进展和观点，重点研究基于自适应结合双麦信号相关性的方案，总体目标是在保真语音情况下提升解混响效果。

网易云信
4年前
1.3k
点赞
评论

实时通信服务中的语音解混响算法实践

低延时、高音质语音通话背后的音频技术解析——降噪与回声消除篇

回声消除的三大算法模块优化在语音通信系统中，回声消除（Echo Cancellation）一直扮演着核心算法的角色。一般来说，回声消除的效果受诸多因素的影响，包括：声学环境，包括反射，混响等；通

RTE开发者社区
4年前
2.3k
6
评论

低延时、高音质语音通话背后的音频技术解析——降噪与回声消除篇