- 在1981年的国家标准GB2312—1980中,每个编码用两字节表示,收录了一级汉字3755个、 二级汉字3008个、各种符号682个,共计7445个
- 最新的汉字编码是2000年公布的国家标准GB18030,它收录了 27484个汉字。编码标 准采用1B、2B和4B。
- 汉字的编码包括汉字的输入编码、汉字内码、汉字字形码三种,是计算机中用于输入、 内部处理和输出三种用途的编码
- 区位码是国家标准局于1981年颁布的标准,它用两字节表示一个汉字,每字节用七位码,并将汉字和图形符号排列在一个94行94列的二维代码表中。区位码是4位十进制数,前2位是区码,后2位是位码,所以称为区位码。
- 国标码将十进制的区位码转换为十六进制数后,再在每字节上加上20H。国标码两字节的最高位都是0, ASCII码的最高位也是0,为了方便计算机区分中文字符和英文字符,将国标码两字节的最高位都改为“1七这就是汉字内码。
- 区位码和国标码都是输入码,它们和汉字内码的关系(十六进制)如下: 国标码=(区位码)16 + 2020H 汉字内码=(国标码)16 + 8080H