字符编码:ASCII、Unicode、UTF-8和字节序

76 阅读1分钟

前言

HTTP 协议基于文本传输,字符编码将文本变为二进制,二进制编码将二进制变为文本。TCP 协议基于二进制传输,数据读取时需要处理字节序。本文将介绍常见的字符编码、二进制编码及字节序,并一探 Golang 中的实现。

引言:如何把“Hello world”变成字节?

  • Step1:得到要表示的全量字符(字符表)

  • Step2:为每个字符指定一个整数编号(编码字符集)

  • Step3:将编号映射成有限长度比特值(字符编码表)

参考:

字符编码:ASCII、Unicode、UTF-8和字节序

阿里面试官让我讲讲Unicode,我讲了3秒说没了,面试官说你可真菜