音视频 Day05 重学音频

402 阅读3分钟

一、PCM

1. 请简单描述录音的原理?
  • 把声源的振动记录下来,在需要时让某个物体按照记录下来的振动规律去振动,就能产生于原来一样的声音。
2. 声音是模拟信号(Analog Signal),而机器存储的是数字信号(Digital Signal),如何把模拟信号存储成数字信号呢?
  • 将音频数字化的常见技术方案是脉冲编码调制(PCM,Pulse Code Modulation),主要过程如下
  • 采样 → 量化 → 编码
3. 什么是采样?采样率?采样定理?
  • 采样(Sampling):每隔一次采集一次模拟信号的样本,是一个时间上将模拟信号离散化(把连续信号转换成离散信号)的过程。
  • 采样率(Sampling Rate):每秒采集的样本数量,称为采样率。比如,采样率 44.1kHz 表示一秒钟采集 44100 个样本。
  • 采样定理:只有当采样率高于声音最高频率的 2 倍时,才能把采集的声音信号唯一还原成原来的声音。
4. 什么是量化?位深度?
  • 量化(Quantization):将每一个采样点的样本值数字化。
  • 位深度(采样精度,采样大小,Bit Depth):使用多少个二进制位来存储位一个采样点的样本值。位深度越高,表示的振幅越精确。常见的 CD 采用 16bit 的位深度。
5. 什么是编码?
  • 编码:将采样和量化后的数字数据转换成二进制码流。

二、其他概念

1.什么是声道?采样率 44.1kHz 、位深度 16bit 的一分钟立体声 PCM 数据有多大?
  • 声道(Channel):单声道产生一组声波数据;双声道产生两组声波数据。
  • 采样率 * 位深度 * 时间 * 声道数 = 44100 * 16 * 60 * 2 = 5292000 bit ≈ 10.09MB
2. 10.09MB 对大部分用户来说都是不能接受的,不改变时长的情况下,如何降低音频数据的大小呢?
  • 两种方案:降低采样指标、压缩
  • 降低采样指标是不可取的,会导致音频的质量下降,用户体验变差,因此专家们研发了各种压缩方案。
3. 什么是比特率?采样率 44.1kHz 、位深度 16bit 的立体声 PCM 数据的比特率是多少?
  • 比特率(Bit Rate):指单位时间内传输或处理的比特数量;单位是:比特每秒(bit/s 或 bps)、千比特每秒(kbit/s 或 Kbps)
  • 比特率 = 采样率 * 位深度 * 声道数 = 44100 * 16 * 2 = 1411.2 Kbps

三、音频的编码与解码

1. 音频的编码(Encode)过程?
  • PCM 数据:未经过压缩的原始音频数据。

image.png

2. 音频的解码(Decode)过程?
  • 当需要播放音频时,得先解码(解压缩)出 PCM 数据,然后再进行播放。

image.png

四、名词学习

1.中文名词解释:脉冲编码、模拟信号、数字信号、采样、采样率
2.中文名词解释:赫兹、声道、比特率
1.英文名词解释:PCM、Analog Signal、Digital Signal、Sampling、Sampling Rate、
2.英文名词解释:Hz、Channel、Bit Rate