字符编码字符集为每个字符分配了一个唯一的编号，通过这个编号就能找到对应的字符。在编程过程中我们经常会使用字符，而使用字符

字符集为每个字符分配了一个唯一的编号，通过这个编号就能找到对应的字符。在编程过程中我们经常会使用字符，而使用字符的前提就是把字符放入内存中，毫无疑问，放入内存中的仅仅是字符的编号，而不是真正的字符实体。

这就抛出了一个问题，如何才能将字符编号放入内存中呢？

对于 ASCII 字符集，这很容易。ASCII 总共包含 128 个字符，用 7 个比特位（Bit）恰好能够存储，不过考虑到计算机一般把字节（Byte）作为基本单元，为了操作方便，我们不妨用一个字节（也就是 8 个比特位）来存储 ASCII。这样虽然浪费了一个比特位，但是读写效率提高了。

但是对于 Unicode，问题就没有这么简单了。Unicode 目前已经包含了上百万的字符，位置靠前的字符用一个字节就能存储，位置靠后的字符用三个字节才能存储。我们可以为所有字符都分配三个字节的内存，也可以为编号小的字符分配一个字节或者两个字节的内存，而为编号大的字符分配三个字节的内存。