音视频基础概念声音是波。声音是由物体震动而产生的，声波的三要素是频率、振幅和波形。频率代表音阶的高低。振幅代表响度

1 声音的物理性质

声音是波。声音是由物体震动而产生的，

声波的三要素是频率、振幅和波形。频率代表音阶的高低。

为了将模拟信号数字化，需要进行采样、量化和编码。采样是在时间轴上对信号进行数字话。需要对最高频率的2倍进行采样（采样定律）量化:是在幅度轴上面进行对信号的数字话。例如16进制表示一个采样编码:按照一定格式记录采样和量化后的数字数据，

在音频采样数据的时候，如果放在CD上面，那么占用的存储空间是可以接受的，但是如果放在网络中实时传播的话，那么数据亮就会比较大，所以就必须要进行压缩编码压缩编码的基本指标之一就是压缩比压缩比通常小于1 否则没有必要压缩了

常用的压缩编码格式

音质非常好，大部分软件都支持
多媒体开发的中间文件、保存音乐和音效素材

大量软件都支持。对兼容性比较高的音乐欣赏

在小于128kbit/s 编码表现游戏，多用于视频中的音频编码

比MP3 更小的码率实现比Mp3更好的音质，高中低表现良好，兼容性不好。适合语音

视频是由一幅副图像组成三色光

红绿蓝无法被分解，所以称为三色光

屏幕中的每一个像素点都是有三个子像素点组成，每一个像素点都对应相应的RGB通道。

对于视频帧的裸数据表示，更多的是YUV数据格式表示，YUV应用于优化彩色视频信号的传输，使其向后兼容老式黑白电视，优势是占用比较少的频宽。Y表示明亮度 U和V描述的是影像的色彩和饱和度。用于制定像素的颜色。常用的YUV是4:2:0

视频的压缩方式也是通过去除冗余信息来进行压缩的。使用帧间编码技术来去除时间上的冗余

1.IPB帧视频压缩中，每一帧代表一副静止的图像，进行压缩的时候会采取各种算法来减少数据的容量。

PTS用于视频的解码，DTS用于视频的解码阶段进行视频的同步和输出，B帧会打乱编码和现实的顺序。大多数解码标准中，编码顺序和解码顺序是不一致的，所以需要两中时间戳。

两个I帧之间就是GOP 由gop_size来设置。代表的是两个I帧之间的帧数目，GOP越大，画质会越来越好，多使用B帧，可以节省大量空间来使用I帧，这个码率相同的情况下会出现更好的画质。