Android 字符编码格式

642 阅读1分钟

1.ASCII  

只需要一个字节,但是只有128个常用字符 2.ANSI

这是各个国家对于ASCII的扩展,通常占两个字节,ASCII仍然占用1个

3.Unicode

为了容纳世界上所有字符诞生。我们一般看到的都是UTF-16

  • ISO/IEC 9959

以Latin为语言基础的其他语言主要是欧洲国家多

  • ISC/IEC 10646 UCS标准

规定了字符集的总体框架

UTF系列规范

  • UTF-8

是一种可变长度的UCS表示方法,又称万国码 比如“你”的

  • ANSI:  0x4F60
  • Unicodebig: 0xFEFF4F60
  • Unicode:0xFFFE604F
  • UTF-8:0xEFBBBFE4BDA0

String类型

String内部对字符存储格式使用的是UTF-16, Stringbuilder线程不安全,buffer是安全的 String的构造函数有对不同编码的转换过程

遗留问题:对于进制之间转换和一些想关知识了解太少,平时也很少用到,在string的构造的转换中,一些运算符也不熟。