01、音视频学习之音频相关的专业术语
1. 音频技术相关术语
- 频率 (Frequency):声音振动的快慢,单位为赫兹(Hz),影响音高。
- 振幅 (Amplitude):声音的强度或响度,决定音量大小。
- 波形 (Waveform):声音信号随时间变化的图形表示,如正弦波、方波。
- 采样率 (Sample Rate):每秒对音频信号采样的次数,常见为44.1kHz(CD质量)。
- 位深 (Bit Depth):每个样本的比特数,决定音频的动态范围,如16位或24位。
- 比特率 (Bitrate):每秒传输的音频数据量,单位为kbps,影响压缩音频质量。
- 编解码器 (Codec):用于压缩和解压缩音频的算法,如MP3、AAC、FLAC。
- 动态范围 (Dynamic Range):音频信号中最响和最安静部分的差值。
- 均衡器 (Equalizer, EQ):调整特定频率范围音量的工具,用于优化音质。
- 混响 (Reverb):声音在空间中反射的效果,常用于模拟环境音效。
- 延迟 (Delay):音频信号的延迟时间,常用于效果处理。
- 声谱图 (Spectrogram):显示音频信号随时间变化的频率和强度的可视化工具。
2. 听力训练与语言学习相关术语
- 听觉辨识 (Auditory Discrimination):区分不同声音或语音的能力,如区分/p/和/b/。
- 语音感知 (Speech Perception):大脑对语言声音的识别和理解过程。
- 音素 (Phoneme):语言中最小的发音单位,如普通话中的声母和韵母。
- 音调 (Pitch):声音的高低,基于频率,常用于语调学习(如汉语声调)。
- 节奏 (Rhythm):声音的时间模式,影响语言或音乐的流畅性。
- 重音 (Stress):在单词或句子中强调某部分,如英语中的重音音节。
- 语调 (Intonation):句子中音高的升降变化,用于表达语气或情感。
- 听写 (Dictation):通过听音频记录内容的训练方法。
- 沉浸式学习 (Immersion):通过大量暴露于音频内容来学习语言或技能。
- 影子跟读 (Shadowing):边听边即时重复音频内容的语言学习技巧。
3. 语音与音频处理相关术语
- 自动语音识别 (Automatic Speech Recognition, ASR):将语音转换为文本的技术。
- 文本转语音 (Text-to-Speech, TTS):将文本转化为语音的技术。
- 语音合成 (Speech Synthesis):生成人工语音的过程,常用于虚拟助手。
- 噪声抑制 (Noise Suppression):去除音频中的背景噪声以提高清晰度。
- 语音分割 (Speech Segmentation):将连续语音分成单词或音素单位。
- 音色 (Timbre):声音的独特“质感”,使不同音源(如人声或乐器)区分开来。
- 声学模型 (Acoustic Model):用于ASR的模型,描述声音与语言单元的关系。
- 语言模型 (Language Model):预测单词或句子序列概率的模型,用于语音识别。
4. 音乐与音频学习相关术语
- 音阶 (Scale):一组按特定顺序排列的音高,如大调音阶、小调音阶。
- 和弦 (Chord):多个音高同时发声,形成和声。
- 节拍 (Beat):音乐中的基本时间单位,决定节奏。
- 音色训练 (Timbre Training):学习辨识不同乐器或声音的音色。
- 听音训练 (Ear Training):通过听觉练习提高音高、和弦、节奏的辨识能力。
- 音程 (Interval):两个音高之间的距离,如大三度、纯五度。