音频图谱（时域、频域、傅里叶） - 风一样的人815的收藏集 - 掘金

音频图谱（时域、频域、傅里叶）

风一样的人815

更多收藏集

11篇文章 · 0订阅

十月份火火火的 GitHub 开源项目

本篇文章盘点 10 月份 GitHub 上比较受欢迎的开源项目，你可以点击上方的 #每月盘点查看历史盘点的开源项目合集。

逛逛GitHub
3年前
19k
141
8

十月份火火火的 GitHub 开源项目

初探语音识别ASR算法

摘要：语音转写文字ASR技术的基本概念与数学原理简介。本文分享自华为云社区《新手语音入门（三）：语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素》，作者：

华为云开发者联盟
4年前
3.9k
3
1

科普丨一文看懂语音识别的技术原理

简要给大家介绍一下语音怎么变文字的吧。希望这个介绍能让所有同学看懂。首先，我们知道声音实际上是一种波。常见的mp3、wmv等格式都是压缩格式，必须转成非压缩的纯波形文件来处理，比如Windows PCM文件，也就是俗称的wav文件。wav文件里存储的除了一个文件头以外，就是声…

FlyAI
8年前
2.4k
23
评论

IOS音视频（四十六）Asr siri 离线在线语音识别方案

最近做了一个语音识别相关的研究，因为公司需要使用离线语音识别功能，为了兼顾性能和价格方面的问题，最终选择的方案是，在线时使用siri,离线使用百度语音识别方案。封装了一个离线在线合成的SDK：语音识别SDK 这个Demo里面没有上传百度libBaiduSpeechSDK.a …

孔雨露
5年前
5.9k
10
评论

IOS音视频（四十六）Asr siri 离线在线语音识别方案

(强烈推荐)移动端音视频从零到上手

音视频的发展正在向各个行业不断扩展，从教育的远程授课，交通的人脸识别，医疗的远程就医等等，音视频方向已经占据一个相当重要的位置，而音视频真正入门的文章又少之甚少，一个刚毕业小白可能很难切入理解,因为音视频中涉及大量理论知识,而代码的书写需要结合这些理论,所以搞懂音视频,编解码等…

小东邪
6年前
50k
856
73

Audio Session:系统与应用程序的中介

Apple通过audio sessions管理app, app与其他app, app与外部音频硬件间的行为.使用audio session可以向系统传达你将如何使用音频.audio session充当着app与系统间的中介.这样我们无需了解硬件相关却可以操控硬件行为. 1.1.…

小东邪
6年前
8.1k
13
评论

快速傅里叶变换（FFT）和小波分析在信号处理上的应用

1前言 1.1傅里叶变换函数f(t)为一元连续函数，其傅里叶变换定义为： F(w)的傅里叶逆变换定义为：其中，i为虚数单位。由欧拉公式：任意绝对可积的连续函数f(t)，都可以用三角函数表示，由于

little_fat_sheep
3年前
430
点赞
评论

如何 FFT(快速傅里叶变换) 求幅度、频率（超详细含推导过程）

如何用python做傅里叶分析？保姆级教学➕全部代码➕原理解释➕推导过程附分步骤代码，让你边看边复现。

Xav_Zewen
3年前
3.3k
3
评论

如何 FFT(快速傅里叶变换) 求幅度、频率（超详细含推导过程）

一步一步教你实现iOS音频频谱动画（一）

很久以前在电脑上听音乐的时候，经常会调出播放器的一个小工具，里面的柱状图会随着音乐节奏而跳动，就感觉自己好专业，尽管后来才知道这个是音频信号在频域下的表现。采样：众所周知，声音是一种压力波，是连续的，然而在计算机中无法表示连续的数据，所以只能通过间隔采样的方式进行离散化，其…

potato04
7年前
22k
123
37

【iOS 音频处理 (1)】音频基础信息

模拟音频：上图蓝色曲线，在时间和振幅都是连续的。比如：磁带，唱片等。数字音频：上图红色点，通过采样和量化获得离散性数据。比如：CD，MP3 等数字格式。采样率 Sampling Rate：单位时间内的采样点，即上图一个区间内红点的个数，单位为 kHz，每秒千个采样。声道数…

刘小蛮
6年前
12k
点赞
评论