VP8编码器对关键帧的判断在webrtc系统中,关键帧的判断一直是一个重要的逻辑,不同的编解码器对关键帧的判断有不同的逻

在webrtc系统中,关键帧的判断一直是一个重要的逻辑,不同的编解码器对关键帧的判断有不同的逻辑, 这里介绍一下VP8的关键帧判断逻辑.

以上两种结构的区别在于PictureID的长度, 左侧结构中pic ID占7位, 右侧结构中pic ID占15位.

可以是3个字节也可以是10个字节, 前3个字节表达的含义都相同
关键帧, 该域占10字节; 内部帧该域占3字节
P : 1位, 是否关键帧, 0 - key, 1 - interframe, 不同于其他结构中扩展位的含义
VER : 3位, 0-3定义了4种不同的解码复杂度的profile
H : 忽略
Size0/1/2 : 19位, 这个RTP包携带的视频帧第一个分片大小, 对于每一个视频帧来说只有第一个RTP包携带了payload header, 而那些没有payload header的RTP包本身所携带的就是负载数据的分片大小
并不是每个RTP包中都含有payload header, 只有在上面的S位置1且PID=0时才存在header, 也就是每个视频帧的第一个RTP包才存在header
3个通用字节后面的7个字节
3字节起始码 : 0x9d, 0x01, 0x2a
接下来的16位 : 14位表示帧的宽度, 另外2位表示水平范围
最后16位 : 14位表示帧的高度, 另外2位表示垂直范围

综上,VP8判断是否关键帧的逻辑为: