首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
音频图谱(时域、频域、傅里叶)
订阅
风一样的人815
更多收藏集
微信扫码分享
微信
新浪微博
QQ
11篇文章 · 0订阅
十月份火火火的 GitHub 开源项目
本篇文章盘点 10 月份 GitHub 上比较受欢迎的开源项目,你可以点击上方的 #每月盘点 查看历史盘点的开源项目合集。
初探语音识别ASR算法
摘要:语音转写文字ASR技术的基本概念与数学原理简介。 本文分享自华为云社区《新手语音入门(三): 语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素》,作者:
科普丨一文看懂语音识别的技术原理
简要给大家介绍一下语音怎么变文字的吧。希望这个介绍能让所有同学看懂。 首先,我们知道声音实际上是一种波。常见的mp3、wmv等格式都是压缩格式,必须转成非压缩的纯波形文件来处理,比如Windows PCM文件,也就是俗称的wav文件。wav文件里存储的除了一个文件头以外,就是声…
IOS音视频(四十六)Asr siri 离线在线语音识别方案
最近做了一个语音识别相关的研究,因为公司需要使用离线语音识别功能,为了兼顾性能和价格方面的问题,最终选择的方案是,在线时使用siri,离线使用百度语音识别方案。 封装了一个离线在线合成的SDK:语音识别SDK 这个Demo里面没有上传百度libBaiduSpeechSDK.a …
(强烈推荐)移动端音视频从零到上手
音视频的发展正在向各个行业不断扩展,从教育的远程授课,交通的人脸识别,医疗的远程就医等等,音视频方向已经占据一个相当重要的位置,而音视频真正入门的文章又少之甚少,一个刚毕业小白可能很难切入理解,因为音视频中涉及大量理论知识,而代码的书写需要结合这些理论,所以搞懂音视频,编解码等…
Audio Session:系统与应用程序的中介
Apple通过audio sessions管理app, app与其他app, app与外部音频硬件间的行为.使用audio session可以向系统传达你将如何使用音频.audio session充当着app与系统间的中介.这样我们无需了解硬件相关却可以操控硬件行为. 1.1.…
快速傅里叶变换(FFT)和小波分析在信号处理上的应用
1前言 1.1傅里叶变换 函数f(t)为一元连续函数,其傅里叶变换定义为: F(w)的傅里叶逆变换定义为: 其中,i为虚数单位。由欧拉公式: 任意绝对可积的连续函数f(t),都可以用三角函数表示,由于
如何 FFT(快速傅里叶变换) 求幅度、频率(超详细 含推导过程)
如何用python做傅里叶分析? 保姆级教学➕全部代码➕原理解释➕推导过程 附分步骤代码,让你边看边复现。
一步一步教你实现iOS音频频谱动画(一)
很久以前在电脑上听音乐的时候,经常会调出播放器的一个小工具,里面的柱状图会随着音乐节奏而跳动,就感觉自己好专业,尽管后来才知道这个是音频信号在频域下的表现。 采样: 众所周知,声音是一种压力波,是连续的,然而在计算机中无法表示连续的数据,所以只能通过间隔采样的方式进行离散化,其…
【iOS 音频处理 (1)】音频基础信息
模拟音频:上图蓝色曲线,在时间和振幅都是连续的。比如:磁带,唱片等。 数字音频:上图红色点,通过采样和量化获得离散性数据。比如:CD,MP3 等数字格式。 采样率 Sampling Rate:单位时间内的采样点,即上图一个区间内红点的个数,单位为 kHz,每秒千个采样。 声道数…