音视频 Day05 重学音频
一、PCM
1. 请简单描述录音的原理?
- 把声源的振动记录下来,在需要时让某个物体按照记录下来的振动规律去振动,就能产生于原来一样的声音。
2. 声音是模拟信号(Analog Signal),而机器存储的是数字信号(Digital Signal),如何把模拟信号存储成数字信号呢?
- 将音频数字化的常见技术方案是
脉冲编码调制(PCM,Pulse Code Modulation),主要过程如下
- 采样 → 量化 → 编码
3. 什么是采样?采样率?采样定理?
采样(Sampling):每隔一次采集一次模拟信号的样本,是一个时间上将模拟信号离散化(把连续信号转换成离散信号)的过程。
采样率(Sampling Rate):每秒采集的样本数量,称为采样率。比如,采样率 44.1kHz 表示一秒钟采集 44100 个样本。
采样定理:只有当采样率高于声音最高频率的 2 倍时,才能把采集的声音信号唯一还原成原来的声音。
4. 什么是量化?位深度?
量化(Quantization):将每一个采样点的样本值数字化。
位深度(采样精度,采样大小,Bit Depth):使用多少个二进制位来存储位一个采样点的样本值。位深度越高,表示的振幅越精确。常见的 CD 采用 16bit 的位深度。
5. 什么是编码?
二、其他概念
1.什么是声道?采样率 44.1kHz 、位深度 16bit 的一分钟立体声 PCM 数据有多大?
- 声道(Channel):单声道产生一组声波数据;双声道产生两组声波数据。
- 采样率 * 位深度 * 时间 * 声道数 = 44100 * 16 * 60 * 2 = 5292000 bit ≈ 10.09MB
2. 10.09MB 对大部分用户来说都是不能接受的,不改变时长的情况下,如何降低音频数据的大小呢?
- 两种方案:降低采样指标、压缩
- 降低采样指标是不可取的,会导致音频的质量下降,用户体验变差,因此专家们研发了各种压缩方案。
3. 什么是比特率?采样率 44.1kHz 、位深度 16bit 的立体声 PCM 数据的比特率是多少?
- 比特率(Bit Rate):指单位时间内传输或处理的比特数量;单位是:比特每秒(bit/s 或 bps)、千比特每秒(kbit/s 或 Kbps)
- 比特率 = 采样率 * 位深度 * 声道数 = 44100 * 16 * 2 = 1411.2 Kbps
三、音频的编码与解码
1. 音频的编码(Encode)过程?

2. 音频的解码(Decode)过程?
- 当需要播放音频时,得先解码(解压缩)出 PCM 数据,然后再进行播放。

四、名词学习
1.中文名词解释:脉冲编码、模拟信号、数字信号、采样、采样率
2.中文名词解释:赫兹、声道、比特率
1.英文名词解释:PCM、Analog Signal、Digital Signal、Sampling、Sampling Rate、
2.英文名词解释:Hz、Channel、Bit Rate