音频的原始数据是以
Pcm格式存储,通过本篇文章,了解Pcm格式相关的知识
一、声音
声音(sound)是由物体振动产生的声波。是通过介质(空气或固体、液体)传播并能被人或动物听觉器官所感知的波动现象。最初发出振动(震动)的物体叫声源。声音以波的形式振动(震动)传播。声音是声波通过任何介质传播形成的运动。
声音是一种波。可以被人耳识别的声(频率在20 Hz~20000 Hz之间),我们称之为声音。
在音视频中,Pcm是将声音这种波使用数字信号采样模拟信号的一种方式,称为脉冲调制编码,那么如何将声音模拟信号转成成Pcm数字表示的状态,主要是经历以下几个步骤
- 采样
- 量化
- 编码
1.1 采样
首先,以下面的音频模拟信号f(x) = sin(x)为例
假设上图中,一个周期(0 - 2π)是一段1s的音频,那么在这段周期内,如果是按模拟信号来讲,那么上面的点会有无数个,为了能够以有限的点来表示这段模拟信号,通过采样的方式,得到一系列的点,如下图所示(图中每个采样点的间隔是一样的,作画时存在误差)
对于在这1s内采样多少次,就产生了一个采样率的概念,比如
1 kHz,表示1s采样1k次44.1 kHz,表示1s采样44.1k次
一般,人耳能够识别20 Hz ~ 20 kHz的声音,那么再根据奈奎斯特定律,采样率要大于或等于信号中两倍的最高频率,这样才能完整保存原始信号中的信息
所以,对于人耳能够识别的最高频率20 kHz,可以使用40 kHz的采样率,不过一般在开发中,是使用44.1 kHz
1.2 量化
前面采样是对1s内,同等间隔进行的操作,那么量化就是对每个采样点进行的数值描述,如下图所示
对于每个采样点,都使用具体的数值进行描述,那么量化的过程就又产生了一个概念,叫做采样位深,比如
8-bit,表示有2^8个等级描述该采样点16-bit,表示有2 ^16等级描述该采样点
1.3 编码
在经历过采样和量化后,就得到了一系列采样点和对应的量化数据,将这些点再进过编码转化为对应的二进制数据存储,就得到了Pcm数据
关于Pcm,还有声道数这一概念,常见的一般有:单声道、双声道
二、PCM格式
关于Pcm常见的格式,主要有:
-
8-bit单声道采样
8-bit采样位深,单声道形式 -
16-bit单声道采样
16-bit采样位深,单声道形式 -
8-bit双声道采样
8-bit采样位深,双声道形式 -
16-bit双声道采样
16-bit采样位深,双声道形式
从上图中可以看出,左右声道是交叉存储的