python中的编码相关

100 阅读1分钟

u r b

u表示后面的字符串是unicode编码,python3中所有的字符串都是unicode字符串
r表示后面的字符串不需要任何的转义
b表示后面的字符串是bytes类型,即b'abc'表示\x61\x62\x63

b前缀只允许 b'abc'和b'\x61\x62\x63'两种形式

bytes和bytearray

bytes: 不可变的字节序列     b'abc'
bytearray: 可变的字节序列   bytearray(b'abc')

编码和解码

将其他编码的字符串decode成unicode字符串,再从unicode字符串encode成另一种编码
xxx ---decode---> unicode ---encode---> yyy

\u和\x

\u之后跟4位十六进制数,取值范围从\u0000到\uFFFF
\x之后跟2位十六进制数,取值范围从\x00到\xFF

\x5F 等于 \u005F