Packable-高效易用的序列化方案本文提出一种良好设计的数据交换格式。可以用于对象序列化/反序列化，消息封装等，从

一、前言

当我们需要对一些信息进行存储或者传输时，通常需要用一种数据协议，将信息转换为可存储或传输的形式（二进制字节流、经过编码的文本等）。
特别地，当数据源是对象时，转化对象的过程被称为序列化，反之，从编码数据转化为对象的过程被称为反序列化。

转换为文本的协议，最常用的是XML和json。
XML协议擅长描述，用于构建网页文档，Android的页面搭建等效果不错，其缺点是解析效率一般。
JSON协议具备较好的可读性，解析效率也不错，面向阅读和面向机器都比较友好，在数据协议的选型时，通常会被优先选用。

通常而言，一些实现得比较好的二进制协议的方案，相对于xml/json协议的各种实现，在效率和编码体积方面有一定优势。
当json协议性能不能满足需求时，大家会转而考虑二进制的数据协议。
而二进制的数据协议，多如牛毛，不可胜数（protobuf, protostuff, thrift, msgpack, avro ...), 挑花了眼，然后发现在易用性方面和json差太多...

在性能和易用性方面，其实有很多空间。
在查了各种资料，耗费了许多时日之后，终于实现了一种既高效又易用的序列化方案。
目前给方案取名：Packable。
取这个名字，主要是参考Android的序列化接口Parcelable。

二、用法

2.1 下载

Packable目前实现了Java、Kotlin、C++、C#、Objective-C、Go等版本。
Java和Kotlin版本代码已发布到Maven仓库，路径如下：

java:

dependencies {
    implementation 'io.github.billywei01:packable-java:2.1.2'
}

kotlin:

dependencies {
    implementation 'io.github.billywei01:packable-kotlin:2.1.2'
}

2.2 使用

以下以Kotlin版本的用法为例。

假设类型定义如下：

data class Person(
    val name: String,
    val age: Int
)

可以定义类型适配器如下：

object PersonAdapter : TypeAdapter<Person> {
    override fun encode(encoder: PackEncoder, target: Person) {
        encoder
            .putString(0, target.name)
            .putInt(1, target.age)
    }

    override fun decode(decoder: PackDecoder): Person {
        return Person(
            name = decoder.getString(0),
            age = decoder.getInt(1)
        )
    }
}

序列化/反序列化：


private fun testEncodeObject() {
    val person = Person("Tom", 20)

    val encoded = PersonAdapter.encode(person)
    val decoded = PersonAdapter.decode(encoded)

    println("Person: ${person == decoded}")
}

private fun testEncodeObjectList() {
    val list = listOf(
        Person("Tom", 20),
        Person("Mary", 18)
    )

    val encoded = PackEncoder.encodeObjectList(list, PersonAdapter)
    val decoded = PackDecoder.decodeObjectList(encoded, PersonAdapter)

    println("Person list: ${list == decoded}")
}

2.3 方法接口

以上是packable的序列化/反序列化的整体用法。
具体到PackEncoder/PackDecoder，又提供了哪些接口呢（支持什么类型）。
以PackEncoder为例，接口如下：

三、Packable协议设计

抛开源码看协议设计和实现分析会比较晦涩乏味，所以如果想了解更多Packable的实现，建议先大概浏览一遍源码；如果对实现代码不感兴趣，可以直接跳转第五节看结论。

3.1 基本编码规则

序列化协议要想支持向前兼容和向后兼容，基本构型都是:

[key value key value ....]

数据布局：

<flag> <type> <index> [length] [data]

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|  flag  | type  |    index    |            value           |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|  1bit  | 3bit  |   4~12 bit  |                            |

1、packable的index从0开始；
2、index和type，固定用一到两个字节编码；
3、value可以不存在（当type=0时）。

当index∈[0,15]时，flag=0, [flag|type|index]用一个字节表示；
当index∈[16,255]时，flag=1 [flag|type|0000]为第一个字节，index独占第二个字节。
目前暂不支持大于255的index, 事实上一个对象也没多么字段，后面真的用上的话，再拓展第一个字节的低4bit即可。

packable的Type定义和作用如下：

Type	Meaning	User For
0	TYPE_0	0，空对象
1	TYPE_NUM_8	boolean, byte, short, int, long
2	TYPE_NUM_16	short, int, long
3	TYPE_NUM_32	int, long, float
4	TYPE_NUM_64	long, double
5	TYPE_VAR_8	长度在[1,255]的可变对象
6	TYPE_VAR_16	长度在[256, 65535]的可变对象
7	TYPE_VAR_32	长度大于65535的可变对象

1、一个对象有时候有很多未赋值的字段，通常默认值是0，空字符串等，可将这类值的type设为0，而lenght和value字段不需要填充。

2、packable在type中定义好了存放了多少个字节。
比如一个long类型的变量，如果其值在[1,255], 编码时将其type设为1, 解码时只读取1个字节。
type∈[1,4]的处理是类似的，看数值的有效位决定需要编码多少字节。

3、当字段为可变对象（字符串，数组，对象）时，从type中就知道用多少字节存储“lenght"。

packable充分利用了type的表示空间，从而节省编码空间和计算时间。

3.2 数组的编码

为简化描述，我们约定

key = <flag> <type> <index>

3.2.1 基础类型数组

基础类型的数据布局:

<key> [length] [v1 v2 ...]

数组元素依此按小端编码；
由于基础数据类型的长度是固定的，所以解码时读取长度之后，除以基础类型的字节数即可得出元素个数。比如，如果是int/float数组，则size = length / 4。

3.2.2 字符串数组

<key> [length] [size] [len1 v1 len2 v2 ...]

由于字符串长度不固定，所以需要编码size.这里用varint去编码size，因为size是正整数（字符串非空时），而且通常比较小，用varint编码能节约空间。
如果数组元素个数为0，则type=0, 此时不需要编码value部分。
字符串的编码由“长度+内容”构成，其中“内容”是可省略的（当字符串为空字符串或者null时）。
当字符串为null时，len=-1。
数组的length从key中的type可以得知本身占多少字节；而字符串的len没有额外信息表示自身占多少字节，为此，len也采用varint编码（一般字符串不会太长，尤其是数组中的字符串，用varint编码可节约空间）。

varint编码，顾名思义，“可变的整数”，用可变长编码表示整数。
4字节的varint的表示方式如下：

   0 ~ 2^07 - 1 0xxxxxxx
2^07 ~ 2^14 - 1 1xxxxxxx 0xxxxxxx
2^14 ~ 2^21 - 1 1xxxxxxx 1xxxxxxx 0xxxxxxx
2^21 ~ 2^28 - 1 1xxxxxxx 1xxxxxxx 1xxxxxxx 0xxxxxxx
2^28 ~ 2^35 - 1 1xxxxxxx 1xxxxxxx 1xxxxxxx 1xxxxxxx 0xxxxxxx

varint编码在较小的正整数通常能节约空间，比如在[0,127]区间的整数可以用一个字节表示，但是在表示较大的整数时节约不了空间，在表示负数时甚至比会占用更多空间。考虑到消息中的字符串通常比较短，所有用varint能节约一些空间。

3.2.3 对象数组

<key> [length] [size] [len1 v1 len2 v2 ...]

对象数组和字符串数组的数据布局一样，
只是len的编码规则不同：

当对象为null时，len=0xFFFF；
len<=0x7FFF时， len用两个字节编码；
当len>0x7FFF时，len用4个字节编码。

为什么不和字符串一样用varint编码呢？
主要是基于实现的层面考虑: 编码对象之前不知道对象需要占用多少个字节，用varint编码的话，不知道要预留给多少空间给len，大概率会预留不准；然后当写入value完成之后，大概率需要移动字节，以便给len预留准确的空间，这样效率就低了。
所以，直接预留两个字节，可以确保长度在32767之内的对象编码写入buffer后不需要移动，以提高效率；
当长度大于32767, 需要向后移动两个字节，而这么长的对象，编码的时间本身就不少，相比而言移动字节的时间占比就低了。

3.2.4 字典

存储key-value对的数据结构，有的编程语言中叫Dictionary，有的叫Map, 是同一个东西。
编码时可以视之为 key-value 的数组：

<key> [length] [size] [k1 v1 k2 v2 ...]

key或value的有各种类型，为基础数据类型时，直接固定长度编码，为可变长类型时，按照可变长类型数组的规则编码。

3.3 压缩编码

对于某些具备特定的特征的数值，可以添加某些编码规则，达到节省空间的目的。
需要声明的是，接下来的这些方法，不一定能”压缩“，仅当符合特征时有效。

3.3.1 bool数组

对于bool数组来说，如果用一个字节编码一个bool值，那太浪费了；
事实上，一个bit表示一个boolean即可，这样一个字节可以编码8个bool值。

3.3.2 枚举数组

当枚举值只能取两种值（比如“是/否”，“可用/不可用”）时，可以用一个bit编码一个值；
当枚举值取值为[0,3]时，可以用2bit编码一个值。
依次类推……
当然，如果枚举值大于255，则直接用int编码就好了。
当枚举值小于等于255时，可以用一个字节编码一个或者多个值。
数据布局bool数组类似：

<key> [length] [remain] [v1 v2  ...]

3.3.3 int/long/double数组

int/long/double作为单个字段，因为type可以记录占用几个字节的信息，所以可以压缩；
而作为数组的元素，是否可以压缩呢？
每个值用额外的2比特记录占用多少字节即可。
2比特可以表示4种情况，下面是2比特从0到4，对应各种类型所取的值。

bits	0	1	2	3
int	-	[0,7]	[0,15]	[0,31]
long	-	[0,7]	[0,15]	[0,63]
double	-	[48-63]	[32,63]	[0,63]

int和long都是从低位开始取值，因为当值比较小时高位为0；
而double由于符号为和阶码在高位，所以从从高位取值，比如对于1, 1.5, 2等值，[16,63]的比特皆为0，所以只需记录高位的2个字节即可。
如果值是0，则只用记录bits皆可，不需要再编码value了。

压缩数组数据布局如下：

<key> [length] [size] [bits] [v1 v2  ...]

size用varint编码；额外的bits跟随在size后，每个值占用2bit; 然后后面的数组根据自己是否可以压缩而决定要占用多少子节。
这种策略不一定有压缩效果，也是要视数组本身而定，通常当大部分元素都比较小时又较好的压缩效果；
极端情况，数组所有元素皆为0，则[v1 v2 ...]部分为空，每个元素只占2bit。

如果需要传输一张数据表的数据，不妨以“列”的方式来组装数据，这样编解码更快；
对于稀疏的字段（多数情况下为0），或者字段的值比较小，建议采用压缩策略。

四、框架实现

限于篇幅，本篇只大概讲一下关键过程，更多细节大家可看源码了解。

4.1 定义类型

回顾上一节，packable的type占用3个bit, 字节的最高的bit用来表示index写在剩余的4bit还是下一个字节。

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|  flag  | type  |    index    |            value           |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|  1bit  | 3bit  |   4~12 bit  |                            |

为此，定义常量如下：

final class TagFormat {
    private static final byte TYPE_SHIFT = 4;
    static final byte BIG_INDEX_MASK = (byte) (1 << 7);
    static final byte TYPE_MASK = 7 << TYPE_SHIFT;
    static final byte INDEX_MASK = 0xF;
    static final int LITTLE_INDEX_BOUND = 1 << TYPE_SHIFT;

    static final byte TYPE_0 = 0;
    static final byte TYPE_NUM_8 = 1 << TYPE_SHIFT;
    static final byte TYPE_NUM_16 = 2 << TYPE_SHIFT;
    static final byte TYPE_NUM_32 = 3 << TYPE_SHIFT;
    static final byte TYPE_NUM_64 = 4 << TYPE_SHIFT;
    static final byte TYPE_VAR_8 = 5 << TYPE_SHIFT;
    static final byte TYPE_VAR_16 = 6 << TYPE_SHIFT;
    static final byte TYPE_VAR_32 = 7 << TYPE_SHIFT;
}

4.2 实现Buffer类

public final class EncodeBuffer {
    byte[] hb;
    int position;
    

    public void writeByte(byte v) {
        hb[position++] = v;
    }

    public void writeShort(short v) {
        hb[position++] = (byte) v;
        hb[position++] = (byte) (v >> 8);
    }

    public void writeInt(int v) {
        hb[position++] = (byte) v;
        hb[position++] = (byte) (v >> 8);
        hb[position++] = (byte) (v >> 16);
        hb[position++] = (byte) (v >> 24);
    }
    // ...
}

Buffer类只需提供基本类型的编码方法即可，buffer扩容由调用者实现。
因为有时候需要连续写入多个值，调用处统一判断扩容，比每次调用Buffer接口都做判断划算。

4.3 实现编码

public final class PackEncoder {
    private final EncodeBuffer buffer;

    final void putIndex(int index) {
        if (index >= TagFormat.LITTLE_INDEX_BOUND) {
            buffer.writeByte(TagFormat.BIG_INDEX_MASK);
        }
        buffer.writeByte((byte) (index));
    }

    public PackEncoder putInt(int index, int value) {
        checkCapacity(6); // 检查buffer容量
        if (value == 0) {
            putIndex(index);
        } else {
            int pos = buffer.position;
            putIndex(index);
            if ((value >> 8) == 0) {
                buffer.hb[pos] |= TagFormat.TYPE_NUM_8;
                buffer.writeByte((byte) value);
            } else if ((value >> 16) == 0) {
                buffer.hb[pos] |= TagFormat.TYPE_NUM_16;
                buffer.writeShort((short) value);
            } else {
                buffer.hb[pos] |= TagFormat.TYPE_NUM_32;
                buffer.writeInt(value);
            }
        }
        return this;
    }
}

编码方法的实现步骤：

1、检查buffer容量，容量不足则扩容
2、写入index
3、写入type
由于index和type所在比特位不同，所以用"|"操作追加即可；
当value为0时，type=0，所以不需要特别写入。
4、写入value
如上举例的是写入int, 根据value的大小写入对应的字节。
比如，假如value < 256, 在只需写入一个字节。
编码其它基础类型大体步骤类似。

编码对象则相对复杂一些。
需要序列化的对象实现Packable的encode方法，用PackEncoder写入对象的字段。
如果对象的字段中又有对象，那个对象也实现Packable即可（编码时会递归调用）。

public interface Packable {
    void encode(PackEncoder encoder);
}

具体编码对象过程如下：

    public PackEncoder putPackable(int index, Packable value) {
        if (value == null) {
            return this;
        }
        checkCapacity(6);
        int pTag = buffer.position;
        putIndex(index);
        // 预留 4 字节，用来存放length
        buffer.position += 4;
        int pValue = buffer.position;
        value.encode(this);
        if (pValue == buffer.position) {
            buffer.position -= 4; // value为空对象，回收预留空间
        } else {
            putLen(pTag, pValue);
        }
        return this;
    }

    private void putLen(int pTag, int pValue) {
        int len = buffer.position - pValue;
        if (len <= 127) {
            buffer.hb[pTag] |= TagFormat.TYPE_VAR_8;
            buffer.hb[pValue - 4] = (byte) len;
            System.arraycopy(buffer.hb, pValue, buffer.hb, pValue - 3, len);
            buffer.position -= 3;
        } else {
            buffer.hb[pTag] |= TagFormat.TYPE_VAR_32;
            buffer.writeInt(pValue - 4, len);
        }
    }

和编码基础类型的步骤类似，只是写入type要后置，因为写入策略是先编码value，结束之后写入value的长度，以及type。
为了避免过多的字节移动，仅当value长度小于127时做compact操作（移动字节，压缩空间）。
那TYPE_VAR_16岂不是用不上了？
编码数组或字符串的时能用上，因为写入buffer前就知道需要占用多少字节，不需要像写入对象一样先预留length的空间。

protobuf的java实现，写入一个对象，需要先遍历每个字段，计算总共占用多少空间，然后写入length, 然后再写入value。如此，对象的每一个字段都要访问两遍（一遍计算长度，一遍写入buffer)。
而packable的写入策略则是调用put方法时即刻写入，这样只需要访问一次各个字段。

4.4 实现解码

public final class PackDecoder {
    static final long NULL_FLAG = ~0;
    static final long INT_MASK = 0xffffffffL;

    private DecodeBuffer buffer;
    private long[] infoArray;
    private int maxIndex = -1;

    private void parseBuffer() {
        // ... 初始化代码 ...
        while (buffer.hasRemaining()) {
            byte tag = buffer.readByte();
            int index = (tag & TagFormat.BIG_INDEX_MASK) == 0 ? tag & TagFormat.INDEX_MASK : buffer.readByte() & 0xff;
            if (index > maxIndex)  maxIndex = index;
            byte type = (byte) (tag & TagFormat.TYPE_MASK);
            if (type <= TagFormat.TYPE_NUM_64) {
                if (type == TagFormat.TYPE_0) {
                    infoArray[index] = 0L;
                } else if (type == TagFormat.TYPE_NUM_8) {
                    infoArray[index] = ((long) buffer.readByte()) & 0xffL;
                } else if (type == TagFormat.TYPE_NUM_16) {
                    infoArray[index] = ((long) buffer.readShort()) & 0xffffL;
                } else if (type == TagFormat.TYPE_NUM_32) {
                    infoArray[index] = ((long) buffer.readInt()) & 0xffffffffL;
                } else {
                    // TYPE_NUM_64的处理相对复杂一些，此处省略 ...
                }
            } else {
                int size;
                if (type == TagFormat.TYPE_VAR_8) {
                    size = buffer.readByte() & 0xff;
                } else if (type == TagFormat.TYPE_VAR_16) {
                    size = buffer.readShort() & 0xffff;
                } else {
                    size = buffer.readInt();
                }
                infoArray[index] = ((long) buffer.position << 32) | (long) size;
                buffer.position += size;
            }
        }
        // 函数结束时，infoArray记录了各index对应的值、或者位置、长度等信息
        // 没有赋值的且下标小于maxIndex的，infoArray[i] = NULL_FLAG
    }

    long getInfo(int index) {
        if (maxIndex < 0) {
            parseBuffer();
        }
        if (index > maxIndex) {
            return NULL_FLAG;
        }
        return infoArray[index];
    }

    public int getInt(int index, int defValue) {
        long info = getInfo(index);
        return info == NULL_FLAG ? defValue : (int) info;
    }

    public <T> T getPackable(int index, PackCreator<T> creator, T defValue) {
        long info = getInfo(index);
        if (info == NULL_FLAG) {
            return defValue;
        }
        int offset = (int) (info >>> 32);
        int len = (int) (info & INT_MASK);
        PackDecoder decoder = pool.getDecoder(offset, len);
        T object = creator.decode(decoder);
        decoder.recycle();
        return object;
    }
}

解码是编码的反操作，基本操作包括：

1、读取(type | indxe)
2、分解 type 和 index
3、根据 type 读取对应的值
读取的值会缓存到infoArray[index]，
其中，如果是基本类型，可以直接将value填入infoArray中，高位补0；
如果是可变长类型，则将offset额length拼凑成long, 再填入infoArray中。
4、调用get方法时读取值
读取基本类型时，直接读取infoArray[index]；
读取可变长类型时，拆解offset和len, 定位到对应位置，读取指定长度的value。

调用getPackable时，如果Packable对象有类型嵌套，会递归调用decode方法，这和编码时的递归是类似的。

五、性能测试

测试对象：

Packable
Protobuf
Gson

测试设备: Macbook Pro

测试代码：Main

测试结果：

	数据大小(byte)	序列化（ms)	反序列化(ms)
packable	2564756 (56%)	8	8
protobuf	2627081 (59%)	16	17
gson	4427344 (100%)	58	50

六、总结

通常而言packable和protobuf性能方面比json的要好，但可读性方面是硬伤。
一种改善可读性的方案：将二进制内容反序列化成Java对象，再用Gson等框架转化为json。

总体而言，packable有以下优点：

1、性能优异
编码解码速度快；
编码后的消息提交小。
2、代码轻量
一方面是包体积，以Java为例，protobuf的jar包接近2M，而packable的jar包只有30K；
另一方面是新增消息类型所需要的代码量，例如前面一节所定义的数据类型，protobuf编译出来的java文件有五千多行，而packable所定义的类文件只有百来行。
3、使用方便
使用protobuf的过程相对繁琐，需要编写.proto文件、编译成对应语言平台的代码、拷贝到项目中、项目集成SDK……
如果需要新增字段，需要修改.proto文件，重新编辑，再次拷贝到项目中。
相对而言，packable可以在现有的对象改造，对于已经定义好的类，实现相关接口即可，相关的实现和调用都不需要变更，
如果需要增删字段，也只需直接在代码中增删字段即可。
4、方法灵活
可以单实现序列化的接口（或者反序列化接口）；
除了对象序列化/反序列化，也支持直接编码，自定义编码等。
5、支持各种类型，可变对象支持null类型（protobuf不支持）。
6、支持多种压缩策略

语言支持方面，packable目前实现了Java、Kotlin、C++、C#、Objective-C、Go等版本，协议是一致的，可以在不同语言平台间相互传输。

项目地址：github.com/BillyWei01/…