录音技术
数码录音技术,是通过计算机中的数字音频接口,将(话筒或其他)音频信号,导入到计算机,录制成波形文件进行存储,再通过多轨录音软件按照需要进行编辑(包括复制、剪切、粘贴),组合成我们所需要的完整文件,最后再输出录制成CD或其他音频格式。
模拟信号
模拟信号是指用连续变化的物理量所表达的信息,如温度、湿度、压力、长度、电流、电压等等,我们通常又把模拟信号称为连续信号,它在一定的时间范围内可以有无限多个不同的取值。 模拟信号主要是与离散的数字信号相对的连续的信号,模拟信号分布于自然界的各个角落,如气温的变化,而数字信号是人为的抽象出来的在幅度取值上不连续的信号。模拟信号百度百科
数字信号
数字信号是在模拟信号的基础上经过采样、量化和编码而形成的。
音频属性
- 声道
- 采样速率
声道
声道(Sound Channel) 是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号,所以声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。
常见的声道:
- 单声道,mono
- 双声道,stereo,最常见的类型,包含左声道以及右声道
- 2.1声道,在双声道基础上加入一个低音声道
- 5.1声道,包含一个正面声道、左前方声道、右前方声道、左环绕声道、右环绕声道、一个低音声道,最早应用于早期的电影院
- 7.1声道,在5.1声道的基础上,把左右的环绕声道拆分为左右环绕声道以及左右后置声道,主要应用于BD以及现代的电影院
采样频率
采样频率,也称为采样速度或者采样率,定义了单位时间内从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数是采样周期或者叫作采样时间,它是采样之间的时间间隔。通俗的讲采样频率是指计算机单位时间内能够采集多少个信号样本。
常用的采样频率:
- 60 Hz (60 fps) - 人眼的理论帧率
- 8,000 Hz - 电话所用采样率, 对于人的说话已经足够
- 11,025 Hz - AM调幅广播所用采样率
- 22,050 Hz和24,000 Hz - FM调频广播所用采样率
- 32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率
- 44,100 Hz - 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率
- 47,250 Hz - 商用 PCM 录音机所用采样率
- 48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率
- 50,000 Hz - 商用数字录音机所用采样率
采样越高,声音的还原就越真实越自然,人对频率的识别范围是 20HZ - 20000HZ, 如果每秒钟能对声音做 20000 个采样, 回放时就足可以满足人耳的需求. 所以 22050 的采样频率是常用的, 44100已是CD音质, 超过48000的采样对人耳已经没有意义。
采样位数
即采样值或取样值,用来衡量量化的参数,是指声卡数字信号的二进制位数。声卡的位客观地反映了对输入信号描述的准确程度。 声卡的主要的作用之一是录制与回放,在这个过程中采样的位数决定了采集的质量。
常用的采样位数:
- 8bit (也就是1字节) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;
- 16bit (也就是2字节) 可以细到 65536 个数, 这已是 CD 标准了;
- 32bit (也就是4字节) 能把振幅细分到 4294967296 个等级
采样位数又叫做量化位数、位深度、分辨率, 它是指声音的连续强度被数字表示后可以分为多少级。
二进制编码
量化所得的结果以二进制的码字进行存放。
其中有两种存放方式:
- 直接以整形来存放量化结果,即Two's complement code
- 以浮点类型来存放量化结果,即Floating point encoding code