首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
语音前端信号处理
订阅
ASR之前的语音信号处理,致力于恢复干净语音。
Carrol302
更多收藏集
微信扫码分享
微信
新浪微博
QQ
10篇文章 · 0订阅
语音识别与合成:技术进展与实践
1.背景介绍 语音识别和语音合成是人工智能领域中的两个重要技术,它们在现代科技产业中发挥着越来越重要的作用。语音识别技术可以将人类的语音信号转换为文本,从而实现人机交互,而语音合成技术则可以将文本转换
深度学习与语音识别:技术进展与实践
1.背景介绍 语音识别,也被称为语音转换(Speech Recognition),是人工智能领域的一个重要研究方向。它旨在将人类语音信号转换为文本信息,从而实现人机交互、语音搜索、语音对话系统等应用。
WebRTC 简单入门与实践
本篇文章以 0 经验音视频开发者 视角,类比常用的 Web 技术,期望帮助您简单入门 WebRTC 技术!
🦖不是DINOSAUR是DINOISER:通过噪声表影响条件序列扩散模型效果
写作动机 这个工作开篇可以看到是在Diffusion-LM的基础上展开叙述的。 因为扩散模型作为新的生成模型在连续域数据上已经取得了比较好的效果,优于其出色的成圣多样性和可控性,因此研究人员可考虑用扩
webrtc4-噪声消除
具体去噪原理可以参考webrtc源码。 webrtc默认接口都是只支持输入10ms的采样数据,并且只支持8000,16000,32000的采样率,非上述类型采样率,需要重采样后才能进行处理。 最新61版本,去噪模块支持输入32k的采样率,但采样个数为160,与上述不符合,需要进…
webrtc3-回声消除
从通讯回音产生的原因看,可以分为声学回音(Acoustic Echo)和线路回音(Line Echo),相应的回声消除技术就叫声学回声消除(Acoustic Echo Cancellation,AEC)和线路回声消除(Line Echo Cancellation, LEC)。 …
前端音视频WebRTC实时通讯的核心
通过上两个系列专栏的学习,我们对前端音视频及 WebRTC 有了初步的了解,是时候敲代码实现一个 Demo 来真实感受下 WebRTC 实时通讯的魅力了。还没有看过的同学请移步: RTCPeerConnection 类是在浏览器下使用 WebRTC 实现实时互动音视频系统中最核…
前端音视频的那些名词
代表每秒传送的比特数。 比特率又称为“二进制位速率”,俗称“码率”,“码流”,又称为数据信号速率。这大兄弟别名好多。。 从传输速度的发展看来,摩尔定律不仅应用在晶体管的密度,同样可以用在传输速度:比特率大概每18个月提高一倍。 比特率越高,代表单位时间传送的数据就越多。 举个例…
实时通信服务中的语音解混响算法实践
本文讲解了网易云信在语音解混响以及提升通信效果方面的一些研发进展和观点,重点研究基于自适应结合双麦信号相关性的方案,总体目标是在保真语音情况下提升解混响效果。
低延时、高音质语音通话背后的音频技术解析——降噪与回声消除篇
回声消除的三大算法模块优化 在语音通信系统中,回声消除(Echo Cancellation)一直扮演着核心算法的角色。一般来说,回声消除的效果受诸多因素的影响,包括: 声学环境,包括反射,混响等; 通