字符编码(常用字符编码)
一、字符编码概况
在计算机世界中所有的文字都是通过编码来实现描述的,如果要避免乱码问题,要清楚常见的编码有哪些。
二、常见的代码
l GBK、GB2312:
表示国标编码,GBK 包含有简体中文和繁体中文,而 GB2312 只包含简体中文,两种编码都是描述中文的编码。
l UNICODE 编码:
是 java 提供的十六进制编码,可以描述世界上任意的文字信息如果现在所有的字母都使用十六进制编码,这个编码太庞大,会造成网络传输的负担
l ISO8859-1:
是国际通用编码,但是所有的编码都要进行转换。
l UTF 编码:
相当于结合了 UNICODE、ISO8859-1 编码,需要使用到 十六 进制的文字,就使用UNICODE 编码,而如果只是字母就使用原始的 ISO8859-1,而常用的就是 UTF-8 编码形式
在以后的开发之中我们使用的编码只有一个:
UTF-8 编码,要想操作代码必须保证你现在的程序编码要正确。
命令行工具上面的编码是 (GBK)