【秒懂音视频开发】重识声音

399 阅读5分钟

产生

声音(Sound),是由物体的振动产生的。一切正在发声的物体都在振动。

  • 我们说话的时候,是声带在振动。一边说话一边用手捂住喉咙,就能感受到声带的振动

497279-20210310090529729-1628092369.png

发声:

497279-20210310090407611-571713795.gif

  • 蜜蜂飞过时发出嗡嗡嗡的声音,是翅膀在快速振动

497279-20210309210330058-1486681790.jpg

声波

本质

关于声音的本质,推荐一份不错的参考资料:可汗学院的《Introduction to sound》

以扬声器为例子,扬声器发声时是振膜在振动。下图是放了块小纸片到振膜上,振膜的振动导致小纸片“跳起了街舞”。

497279-20210309160005740-1136160225.gif

振膜的振动会导致振膜旁边的空气振动,然后导致更大范围的空气跟着一起振动,最后耳朵旁边的空气也开始振动。

497279-20210309173508223-1372169607.gif 空气的振动带来了动能(Kinetic Energy),能量传入了耳朵中,最后就听到了声音。

497279-20210309173508223-1372169607.gif 所以,扬声器可以通过空气来传播能量,而不是传播空气本身。

497279-20210309161920264-1743331815.gif 如果传播的是空气,那么表现出来的形式就不是声音,而是风(Wind)。

497279-20210309164233542-1594088264.gif 声音与有着相同的关键特征:可以通过介质传播能量,而不是传播介质本身。

  • 因此,我们也把声音称为声波
  • 声音的传播介质可以是气体、液体、固体,比如:2个人面对面交流时,声音是通过空气传播到对方耳中

疑惑

学到这里,就可以解开一个很多人长期以来的疑惑了:为什么自己录下来的声音和平时说话的声音,听起来会不太一样?

497279-20210309210336017-1103710196.png

  • 当自己说话的时候,实际上自己听到了2个声音,分别来自2种不同的传播介质

    • 图①:声波 → 空气 → 耳朵
    • 图②:声波 → 血肉、骨骼等介质 → 耳朵
  • 录制声音时

    • 图③:声波 → 空气 → 录音设备
  • 当听自己录下来的声音时,自己只听到了1个声音

    • 图④:声波 → 空气 → 耳朵
  • 所以,平时别人耳中听到的你说话的声音,就是你录音中的声音

人耳

另外,人耳又是如何听到声音的呢?大概过程是:声源 → 耳廓(收集声波) → 外耳道(传递声波) → 鼓膜(将声波转换成振动) → 听小骨(放大振动) → 耳蜗(将振动转换成电信号) → 听觉神经(传递电信号) → 大脑(形成听觉)

497279-20210309000035654-86549619.jpg

振幅

如果只关注单个空气分子,可以发现:它来回振动的轨迹,就是一个正弦或余弦函数的曲线图

单个空气分子: 497279-20210309204536841-1533531651.gif 横轴:代表时间。

497279-20210309210339811-316492160.png 纵轴:代表空气分子来回振动时产生的位移。

497279-20210309210102445-705640882.gif 蓝色的中心线:代表该空气分子的未受振动干扰时的位置(平衡位置,Equilibrium Position)。

从平衡位置到最大位移位置之间的距离,叫做振幅(Amplitude)。

497279-20210309212327524-1190711175.gif

周期

空气分子完全来回振动一次所花费的时间,叫做周期(Period),单位是秒(s)。

497279-20210309223036779-1399044801.gif

497279-20210309223830471-987247162.gif

频率

物体每秒来回振动的次数,叫做频率(Frequency),也就是周期分之一。

  • 单位是秒分之一(1/s),也称为赫兹(Hz)
  • 比如440Hz代表物体每秒来回振动440次
  • 因此,频率用来表示物体振动的快慢

理论上,人类的发声频率是85Hz ~ 1100Hz,人类只能听见20Hz ~ 20000Hz之间的声音。

  • 低于20Hz的称为:次声波(Infrasound)
  • 高于20000Hz的称为:超声波(Ultrasound)

人和动物的发声和听觉频率

497279-20210309232219261-1855863610.jpg

音调

频率越高,音调就越高。

497279-20210309234016863-2109068081.gif

频率越低,音调就越低。 497279-20210309234230119-1154471356.gif

通常女生讲话时,声带振动的频率就比较高,因此我们听到的音调就高,有时会有点刺耳,而男生讲话时,声带振动的频率就比较低,因此我们听到的音调就低,显得比较低沉。

响度

当提高声音的响度(音量,大小)时,振动的幅度会变大。 497279-20210309211133607-932972734.gif 我们常用dB(分贝)来描述声音的响度。

分贝情景
0刚能听到的声音
15以下感觉安静
30耳语的音量大小
40冰箱的嗡嗡声
60正常交谈的声音
70相当于走在闹市区
85汽车穿梭的马路上
95摩托车启动声音
100装修电钻的声音
110卡拉OK、大声播放MP3的声音
120飞机起飞时的声音
150燃放烟花爆竹的声音

音色

概念

音色(Timbre)是指声音的特色。

  • 不同的声源由于其材料、结构不同,则发出声音的音色也不同
  • 我们之所以能够根据声音区分出不同的乐器、不同的人,都是因为它们的音色不同
  • 不同音色的声音,即使在同一响度和同一音调的情况下,也能让人区分开来

微信的声音登录功能,就是基于不同人不同音色的原理,为每一个人私人定制一把声音锁。

原理

通常声源的振动产生的并不是单一频率的声波,而是由基音和不同频率的泛音组成的复合声音。

  • 当声源的主体振动时会发出一个基音(基本频率,基频,Fundamental Frequency)
  • 同时其余各部分也有复合的声源,这些声源组合产生泛音
  • 泛音(Overtone)其实就是物理学上的谐波(Harmonic)

音调是由基音决定的,而音色主要取决于泛音

从下图可以看得出来,音色不同,波形也就不同。

497279-20210408094902031-163154257.jpg 下图形象生动地展示了:声音的最终波形是由多个不同的波形组合而成的。

497279-20210408094904934-2003923078.gif

497279-20210408094907820-412969234.gif

好了,今天就讲到这里了,大家是否觉得这些都过于基础了,不就是声音嘛,其实这些基础都是为后面开发音视频有很大的关系,把基础打好了到后面你才能更加容易听懂,毕竟磨刀不误砍柴工