01、音视频学习之音频相关的专业术语

2025-09-12 177 阅读3分钟

1. 音频技术相关术语

频率 (Frequency)：声音振动的快慢，单位为赫兹（Hz），影响音高。
振幅 (Amplitude)：声音的强度或响度，决定音量大小。
波形 (Waveform)：声音信号随时间变化的图形表示，如正弦波、方波。
采样率 (Sample Rate)：每秒对音频信号采样的次数，常见为44.1kHz（CD质量）。
位深 (Bit Depth)：每个样本的比特数，决定音频的动态范围，如16位或24位。
比特率 (Bitrate)：每秒传输的音频数据量，单位为kbps，影响压缩音频质量。
编解码器 (Codec)：用于压缩和解压缩音频的算法，如MP3、AAC、FLAC。
动态范围 (Dynamic Range)：音频信号中最响和最安静部分的差值。
均衡器 (Equalizer, EQ)：调整特定频率范围音量的工具，用于优化音质。
混响 (Reverb)：声音在空间中反射的效果，常用于模拟环境音效。
延迟 (Delay)：音频信号的延迟时间，常用于效果处理。
声谱图 (Spectrogram)：显示音频信号随时间变化的频率和强度的可视化工具。

2. 听力训练与语言学习相关术语

听觉辨识 (Auditory Discrimination)：区分不同声音或语音的能力，如区分/p/和/b/。
语音感知 (Speech Perception)：大脑对语言声音的识别和理解过程。
音素 (Phoneme)：语言中最小的发音单位，如普通话中的声母和韵母。
音调 (Pitch)：声音的高低，基于频率，常用于语调学习（如汉语声调）。
节奏 (Rhythm)：声音的时间模式，影响语言或音乐的流畅性。
重音 (Stress)：在单词或句子中强调某部分，如英语中的重音音节。
语调 (Intonation)：句子中音高的升降变化，用于表达语气或情感。
听写 (Dictation)：通过听音频记录内容的训练方法。
沉浸式学习 (Immersion)：通过大量暴露于音频内容来学习语言或技能。
影子跟读 (Shadowing)：边听边即时重复音频内容的语言学习技巧。

3. 语音与音频处理相关术语

自动语音识别 (Automatic Speech Recognition, ASR)：将语音转换为文本的技术。
文本转语音 (Text-to-Speech, TTS)：将文本转化为语音的技术。
语音合成 (Speech Synthesis)：生成人工语音的过程，常用于虚拟助手。
噪声抑制 (Noise Suppression)：去除音频中的背景噪声以提高清晰度。
语音分割 (Speech Segmentation)：将连续语音分成单词或音素单位。
音色 (Timbre)：声音的独特“质感”，使不同音源（如人声或乐器）区分开来。
声学模型 (Acoustic Model)：用于ASR的模型，描述声音与语言单元的关系。
语言模型 (Language Model)：预测单词或句子序列概率的模型，用于语音识别。

4. 音乐与音频学习相关术语

音阶 (Scale)：一组按特定顺序排列的音高，如大调音阶、小调音阶。
和弦 (Chord)：多个音高同时发声，形成和声。
节拍 (Beat)：音乐中的基本时间单位，决定节奏。
音色训练 (Timbre Training)：学习辨识不同乐器或声音的音色。
听音训练 (Ear Training)：通过听觉练习提高音高、和弦、节奏的辨识能力。
音程 (Interval)：两个音高之间的距离，如大三度、纯五度。