音频的原始数据是以Pcm格式存储，通过本篇文章，了解Pcm格式相关的知识

一、声音

声音（sound)是由物体振动产生的声波。是通过介质（空气或固体、液体）传播并能被人或动物听觉器官所感知的波动现象。最初发出振动（震动）的物体叫声源。声音以波的形式振动（震动）传播。声音是声波通过任何介质传播形成的运动。

声音是一种波。可以被人耳识别的声（频率在20 Hz~20000 Hz之间），我们称之为声音。

在音视频中，Pcm是将声音这种波使用数字信号采样模拟信号的一种方式，称为脉冲调制编码，那么如何将声音模拟信号转成成Pcm数字表示的状态，主要是经历以下几个步骤

采样
量化
编码

1.1 采样

首先，以下面的音频模拟信号f(x) = sin(x)为例

音频模拟信号.png

假设上图中，一个周期（0 - 2π）是一段1s的音频，那么在这段周期内，如果是按模拟信号来讲，那么上面的点会有无数个，为了能够以有限的点来表示这段模拟信号，通过采样的方式，得到一系列的点，如下图所示（图中每个采样点的间隔是一样的，作画时存在误差）

采样.png

对于在这1s内采样多少次，就产生了一个采样率的概念，比如

1 kHz，表示1s采样1k次
44.1 kHz，表示1s采样44.1k次

一般，人耳能够识别20 Hz ~ 20 kHz的声音，那么再根据奈奎斯特定律，采样率要大于或等于信号中两倍的最高频率，这样才能完整保存原始信号中的信息

所以，对于人耳能够识别的最高频率20 kHz，可以使用40 kHz的采样率，不过一般在开发中，是使用44.1 kHz

1.2 量化

前面采样是对1s内，同等间隔进行的操作，那么量化就是对每个采样点进行的数值描述，如下图所示

量化.png

对于每个采样点，都使用具体的数值进行描述，那么量化的过程就又产生了一个概念，叫做采样位深，比如

8-bit，表示有2^8个等级描述该采样点
16-bit，表示有2 ^16等级描述该采样点

1.3 编码

在经历过采样和量化后，就得到了一系列采样点和对应的量化数据，将这些点再进过编码转化为对应的二进制数据存储，就得到了Pcm数据

关于Pcm，还有声道数这一概念，常见的一般有：单声道、双声道

二、PCM格式

PCM格式.png

关于Pcm常见的格式，主要有：

8-bit 单声道

采样8-bit采样位深，单声道形式
16-bit 单声道

采样16-bit采样位深，单声道形式
8-bit 双声道

采样8-bit采样位深，双声道形式
16-bit 双声道

采样16-bit采样位深，双声道形式

从上图中可以看出，左右声道是交叉存储的

Android 音视频开发【音频篇】【一】PCM格式

一、声音

1.1 采样

1.2 量化

1.3 编码

二、PCM格式