字符编码

54 阅读1分钟
  • UTF-16是Unicode的其中一个使用方式。UTF是Unicode Transfer Format的缩写,即把Unicode转做某种格式的意思
  • 在Unicode基本多文种平面定义的字符(无论是拉丁字母、汉字或其他文字或符号),一律使用2字节储存。而在辅助平面定义的字符,会以代理对(surrogate pair)的形式,以两个2字节的值来储存
  • UTF-16比起UTF-8,好处在于大部分字符都以固定长度的字节(2字节)储存,但UTF-16却无法兼容于ASCII编码