字符集和比较规则
字符集就是字符范围+编码规则(映射规则)
比较规则就是 按照一定的规则比较大小
一些比较重要的字符集
asscii 字符集
- 128字符
- 一个字节
- 空格 标点 数字 大小写字母
ISO 8859-1 字符集 (latin1 拉丁)
- 256字符
- 一个字节
- 空格 标点 数字 大小写字母
- 西欧洲常见字符
GB2321 字符集
- 6763字符
- 一个字节、两个 字节
- 空格 标点 数字 大小写字母
- 汉语言
- 日本 希腊 拉丁 俄语
- 兼容 ascii
- 如果字符是ascii字符集中就是一个字节,否则两个字节
GBK 字符集
- 对GB2321 扩充
- 兼容GB2321
utf 字符集
- 字符
- 1~4个字节
- utf8只是Unicode字符集的一种编码方案,Unicode字符集可以采用utf8、utf16、utf32这几种编码方案,
- utf8使用1~4个字节编码一个字符,utf16使用2个或4个字节编码一个字符,utf32使用4个字节编码一个字符