持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第2天
五、字符串的编码格式
字节:计算机最小存储单位 1B=8bit
字符:单个的数字、文字与符号
字符集(码表):存储字符与二进制序列的对应关系。
编码:将字符转换为对应的二进制序列的过程。A ---》
解码:将二进制序列转换为对应的字符的过程。
Python中,常用的字符串编码方式有:ASCII码、GB2312码、GBK码、Unicode码、UTF-8码等。在Python2.x中,默认的字符编码是ASCII,默认的文件编码也是ASCII。而在Python3.x中,默认的字符编码是Unicode,默认的文件编码是UTF-8。
ASCII码
BG2312码和BGK码
Unicode码
UTF-8、UTF-16、 UTF-32
f=open("a.txt")
bb=f.read()
print(bb)
bb=f.read()
print(bb)
f=open( **"a.txt"** ,encoding= **"unicode"** )
六、字符串的内置函数:
1、字符的编码与解码
语法格式 :
ord(字符) ord是ordinal的缩写,序数
chr(整数) chr是character的缩写,字符
案例:
chr(9800)—chr(9811) 星座
ord(“A”)
ord(“张”)
ord(“王”)
字符串比较大小,按编码比较
2、获取字符串的长度、最大、最小
语法格式:
len(参数)
max(参数)
min(参数)
字符都是按一个字节计算,不区分英文和中文
案例:
aa=input(“请输入一句话:”)
print(len(aa))
print(max(aa))
print(min(aa))
七、转义字符
转义字符:改变字符的原始含义
例如:单引号原始含义是代表字符串。加上\表示单引号
print( "nihao'wohao'dgg" )
print( "nihao"wohao"dgg" )
print( "nihao" wohao "dgg" ) 出错
如果字符串中既包含单引号,又包含双引号,须使用转义字符(反斜线“\”)。
如果字符串中包含反斜线,也需要对它进行转义。
在Python中,当我们需要在字符串中使用特殊字符时,用反斜线“\”来转义字符。
| 转义字符 | 描述 |
|---|---|
| \ | 字符串行尾的续行符,即一行未完,转到下一行继续写。 |
| \ | 反斜线 |
| ' | 单引号 |
| " | 双引号 |
| \n | 换行符 |
| \r | 回车符 |
| \f | 换页 |
| \000 | 空 |
| \a | 蜂鸣器响铃。注意不是喇叭发声,现在的计算机很多都不带蜂鸣器了,所以响铃不一定有效。 |
| \b | 退格(Backspace) |
| \t | 水平制表符/横向制表符,即Tab键,一般相当于四个空格。 |
| \v | 垂直制表符/纵向制表符 |
| \other | 其它的字符以普通格式输出 |
单引号已经作为字符串的定界符了,想要单引号,只能\’
Python支持原始字符串。在原始字符串中,反斜线(“\”)不被当作转义字符,所有的内容都保持“原汁原味”。原始字符串以“r”开头。原始字符串的代码示例:
"C:\Users\jj"
str2 = r"C:\Users\jj"
也可用一对单引号及三个单引号或双引号将字符串括起来
print( "这是一个原始字符串使用的例子:" )
*print(str2)
例1:用一句print输出:我是“齐天大圣”孙悟空
print( '我是” 齐天大圣“ \t孙悟空 ' )
我是“齐天大圣” 孙悟空
print('我是”齐天大圣“\n孙悟空')