01、音视频学习之音频相关的专业术语

117 阅读3分钟

1. 音频技术相关术语

  • 频率 (Frequency):声音振动的快慢,单位为赫兹(Hz),影响音高。
  • 振幅 (Amplitude):声音的强度或响度,决定音量大小。
  • 波形 (Waveform):声音信号随时间变化的图形表示,如正弦波、方波。
  • 采样率 (Sample Rate):每秒对音频信号采样的次数,常见为44.1kHz(CD质量)。
  • 位深 (Bit Depth):每个样本的比特数,决定音频的动态范围,如16位或24位。
  • 比特率 (Bitrate):每秒传输的音频数据量,单位为kbps,影响压缩音频质量。
  • 编解码器 (Codec):用于压缩和解压缩音频的算法,如MP3、AAC、FLAC。
  • 动态范围 (Dynamic Range):音频信号中最响和最安静部分的差值。
  • 均衡器 (Equalizer, EQ):调整特定频率范围音量的工具,用于优化音质。
  • 混响 (Reverb):声音在空间中反射的效果,常用于模拟环境音效。
  • 延迟 (Delay):音频信号的延迟时间,常用于效果处理。
  • 声谱图 (Spectrogram):显示音频信号随时间变化的频率和强度的可视化工具。

2. 听力训练与语言学习相关术语

  • 听觉辨识 (Auditory Discrimination):区分不同声音或语音的能力,如区分/p/和/b/。
  • 语音感知 (Speech Perception):大脑对语言声音的识别和理解过程。
  • 音素 (Phoneme):语言中最小的发音单位,如普通话中的声母和韵母。
  • 音调 (Pitch):声音的高低,基于频率,常用于语调学习(如汉语声调)。
  • 节奏 (Rhythm):声音的时间模式,影响语言或音乐的流畅性。
  • 重音 (Stress):在单词或句子中强调某部分,如英语中的重音音节。
  • 语调 (Intonation):句子中音高的升降变化,用于表达语气或情感。
  • 听写 (Dictation):通过听音频记录内容的训练方法。
  • 沉浸式学习 (Immersion):通过大量暴露于音频内容来学习语言或技能。
  • 影子跟读 (Shadowing):边听边即时重复音频内容的语言学习技巧。

3. 语音与音频处理相关术语

  • 自动语音识别 (Automatic Speech Recognition, ASR):将语音转换为文本的技术。
  • 文本转语音 (Text-to-Speech, TTS):将文本转化为语音的技术。
  • 语音合成 (Speech Synthesis):生成人工语音的过程,常用于虚拟助手。
  • 噪声抑制 (Noise Suppression):去除音频中的背景噪声以提高清晰度。
  • 语音分割 (Speech Segmentation):将连续语音分成单词或音素单位。
  • 音色 (Timbre):声音的独特“质感”,使不同音源(如人声或乐器)区分开来。
  • 声学模型 (Acoustic Model):用于ASR的模型,描述声音与语言单元的关系。
  • 语言模型 (Language Model):预测单词或句子序列概率的模型,用于语音识别。

4. 音乐与音频学习相关术语

  • 音阶 (Scale):一组按特定顺序排列的音高,如大调音阶、小调音阶。
  • 和弦 (Chord):多个音高同时发声,形成和声。
  • 节拍 (Beat):音乐中的基本时间单位,决定节奏。
  • 音色训练 (Timbre Training):学习辨识不同乐器或声音的音色。
  • 听音训练 (Ear Training):通过听觉练习提高音高、和弦、节奏的辨识能力。
  • 音程 (Interval):两个音高之间的距离,如大三度、纯五度。