u r b
u表示后面的字符串是unicode编码,python3中所有的字符串都是unicode字符串
r表示后面的字符串不需要任何的转义
b表示后面的字符串是bytes类型,即b'abc'表示\x61\x62\x63
b前缀只允许 b'abc'和b'\x61\x62\x63'两种形式
bytes和bytearray
bytes: 不可变的字节序列 b'abc'
bytearray: 可变的字节序列 bytearray(b'abc')
编码和解码
将其他编码的字符串decode成unicode字符串,再从unicode字符串encode成另一种编码
xxx ---decode---> unicode ---encode---> yyy
\u和\x
\u之后跟4位十六进制数,取值范围从\u0000到\uFFFF
\x之后跟2位十六进制数,取值范围从\x00到\xFF
\x5F 等于 \u005F