从H.264码流中一眼读出其Profile和Level

2,768 阅读4分钟

H.264是目前业界使用最多的视频编码格式,广泛应用于直播、视频会议、在线教育和远程医疗等领域。本篇分享的文章假设你已经对H.264已经有了一些基本的了解,例如已经知道什么是SPS和PPS,知道什么是I帧、P帧和B帧,知道了NALU的抽象概念,知道了Profile和Level的概念,否则本篇文章可能暂时不适合你。

Profile和Level是H.264中一个非常重要的概念,Profile用于确定视频编码过程中帧间压缩使用的算法(例如是否包含B帧、CABAC支持、颜色空间支持等),Profile越高,就说明采用了越高级的压缩特性,对应的对编解码硬件的要求也越高;Level是对视频本身特性的一些描述(码率,分辨率,fps等),Level越高,视频的码率、分辨率、fps越高。下面两张图来自维基百科,分别对应了不同的Profiel和Level支持的能力和特性。

H264 Profile

H264 Level

对于H.264的Profile和Level比较专业化(你这么去描述,行业里的人会认为你很专业)的描述是:Profile@Level,例如Main@4.2,Baseline@3.1,High@5.0。

我们知道,H.264对于计算机来说,本质上其实就是一连串随着时间推移的比特流,至于这些比特流分别代表什么意义,制定H.264标准的那帮家伙给定义好了,大家只要都遵守这个标准就可以了。我们如何从一连串的H.264比特流里快速地读出其Profile和Level呢,这是本篇的重点。

在H.264标准中,Profile和Level信息是定义在SPS NALU中的,SPS又是H.264的第一个NALU,所以知道了SPS这个NALU中每一个字节的意义就可以很快地从中分辨出Profile和Level。

下图是H.264官方标准中对于SPS RBSP的定义。

SPS RBSP

PS:H.264的官方标准定义参考:H.264标准

根据H.264标准定义,SPS的RBSP,第1个字节和3个字节分别代表profile_idc和了level_idc信息。如果加上起始码(Annex-B格式)的3或4个字节,再加上1个字节的NALU Header,那一个H.264裸流的第6(或5)个字节就是profile_idc,第8(或7)个字节就是Level_idc,只要读出这两个字节的数值就可以快速方便地得到这个H.264流的Profile和Level。

Profile & Level byte

profile_idc字段各值代表的含义如下。

profile_idc(十进制)含义
66Baseline
77Main
88Extended
100High (FRExt)
110High 10 (FRExt)
122High 4:2:2 (FRExt)
166High 4:4:4 (FRExt)

实际使用中,Baseline,Main和High Profile比较常见,我们只需要记住几个关键的数字即可。66:Baseline,77:Main,>=100:High

level_idc字段代表的含义如下。

level_idc(十进制)含义
101 (supports only QCIF format and below with 380160 samples/sec)
11.1 (CIF and below. 768000 samples/sec)
121.2 (CIF and below. 1536000 samples/sec)
131.3 (CIF and below. 3041280 samples/sec)
202 (CIF and below. 3041280 samples/sec)
212.1 (Supports HHR formats. Enables Interlace support. 5068800 samples/sec)
222.2 (Supports SD/4CIF formats. Enables Interlace support. 5184000 samples/sec)
303 (Supports SD/4CIF formats. Enables Interlace support. 10368000 samples/sec)
313.1 (Supports 720p HD format. Enables Interlace support. 27648000 samples/sec)
323.2 (Supports SXGA format. Enables Interlace support. 55296000 samples/sec)
404 (Supports 2Kx1K format. Enables Interlace support. 62914560 samples/sec)
414.1 (Supports 2Kx1K format. Enables Interlace support. 62914560 samples/sec)
424.2 (Supports 2Kx1K format. Frame coding only. 125829120 samples/sec)
505 (Supports 3672x1536 format. Frame coding only. 150994944 samples/sec)
515.1 (Supports 4096x2304 format. Frame coding only. 251658240 samples/sec)

Level很简单,level_idc的十进制数值除以10即是H.264的Level值。

结合上面三个表格即可快速计算出Profile和Level信息,下面是三个例子。

例子:码流1

SPS RBSP

Profile = 0x42 = 66 = Baseline, Level = 0x1F = 31 = 3.1; 所以该码流可以描述为Baseline@L3.1

例子:码流2

SPS RBSP

Profile = 0x4D = 77 = Main, Level = 0x28 = 40 = 4.0; 所以该码流可以描述为Main@L4.0

例子:码流3

SPS RBSP

Profile = 0x64 = 100 = High, Level = 0x28 = 40 = 4.0; 所以该码流可以描述为High@L4.0

欢迎大家留言交流