【音视频入门基础】—— 声音是什么

222 阅读2分钟

声音的概念

正常的声音是模拟信号,即连续变化的信号。图形类似于三角函数的图像。 就像下面这样: 在这里插入图片描述

但是,总所周知。计算机传输都是0和1,显然上面这种连续的数据跟01压根不沾边。所以,就需要将它转称为01数据,也就是数字信号。      

模数转换

模数转换,也就是将模拟信号转化成数字信号。这一切都是通过A/D转换器(ADC)来实现的。

ADC具体的原理我们不做过多分析。重点看一下采样问题。

采样是一种微积分的思想,就是对横坐标取微分(当然实际中不会趋近到无穷),对y值取样。 如下图: 在这里插入图片描述

当横坐标取值区间越小,得到的采样数据越多,声音质量也就越高。 无限采样之后,就是一个模拟信号了。 但实际中,不会无穷无尽的取,因为数据样本太大,传输起来就会有困难了。

一般都会规定一个区间,即每秒取多少次,也就是采样率。

 

采样基本概念

  • 采样大小:一个采样用多少bit存放。常用的是16bit(两个字节)。采样大小越大,描述的峰值越大,对比到模拟信号图上面,也就是声音的强度描述的更清晰。
  • 采样率: 也就是每秒钟采样多少次。采样率越高,数字信号与模拟信号的差别越小,声音损失越小。一般打电话8k就够用了。48k基本上就是与正常的声音无异了。
  • 声道数:单声道、双声道、多声道。      

PCM 和 WAV

PCM。Pulse Code Modulation,脉冲编码调制,是数字通信的编码方式之一。主要过程是将话音、图像等模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的幅值。

讲人话,就是一组二进制数据,即模数转化之后的原始数据。

WAV,pcm就是一组数据,它没有格式。对pcm进行封装,将它装进一个容器里面,这个容器就是wav。

  • 如何计算一个原始pcm音频流的码率? 采样率 采样大小 * 声道数*

比如采样率44.1kHz,采样大小16bit,双声道的pcm编码的wav文件,其码率为:44.1k162 = 1411.2kb/s