Protobuf
Google的Protobuf做数据编码,一直没有深入理解其中的原理,最近做了一次通讯抓包,发现其中很多Protobuf编码的数据包,于是决定分析一下其中的数据包及其编码
由上图我们可以很清楚的看到,protobuf编码其实类似tlv(tag length value)编码, 其内部就是(tag, length, value)的组合,
- tag由(field_number<<3)|wire_type计算得出,
- field_number由我们在proto文件中定义,
- wire_type由protobuf根据proto中定义的字段类型决定,
- length长度采用一种叫做Varint 的数字表示方法,
它是一种紧凑的表示数字的方法,用一个或多个字节来表示一个数字,值越小的数字使用越少的字节数, 具体细节可以谷歌Varint。总之Protobuf 序列化后所生成的二进制消息非常紧凑,这得益于 Protobuf 采用了上面的 Encoding 方法。