Unicode和UTF-8的关系?
Unicode是字符集,收录了很多字符,每个字符有唯一的Unicode码(其实就是使用数字表示字符),一个Unicode码固定占4字节;UTF-8是一种编码方式,属于变长编码,使用1到4个字节来表示Unicode码,决定了一个字符编码后的二进制字节流长啥样。UTF-8是基于Unicode字符集进行编码的,编码一个字符:首先,去Unicode字符集查找对应的Unicode码,然后使用1到4个字节去表示这个Unicode码,从而完成编码。
UTF-8的好处:
- 节省了空间,每个Unicode码占4个字节,若直接使用Unicode码进行编码太浪费空间了。
- 兼容ASCII码,每个ASCII字符还是占用1个字节。