字符串(二)

100 阅读3分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第2天

五、字符串的编码格式

字节:计算机最小存储单位 1B=8bit

字符:单个的数字、文字与符号

字符集(码表):存储字符与二进制序列的对应关系。

编码:将字符转换为对应的二进制序列的过程。A  ---》

解码:将二进制序列转换为对应的字符的过程。

Python中,常用的字符串编码方式有:ASCII码、GB2312码、GBK码、Unicode码、UTF-8码等。在Python2.x中,默认的字符编码是ASCII,默认的文件编码也是ASCII。而在Python3.x中,默认的字符编码是Unicode,默认的文件编码是UTF-8。

ASCII码

BG2312码和BGK码

Unicode码

UTF-8、UTF-16、 UTF-32

image.png

image.png

f=open("a.txt")

bb=f.read()

print(bb)

image.png


bb=f.read()

print(bb)

f=open( **"a.txt"** ,encoding= **"unicode"** )

image.png

image.png

六、字符串的内置函数:

1、字符的编码与解码

语法格式 :

ord(字符)   ord是ordinal的缩写,序数

chr(整数)   chr是character的缩写,字符

案例:

chr(9800)—chr(9811) 星座

ord(“A”)

ord(“张”)

ord(“王”)

字符串比较大小,按编码比较

2、获取字符串的长度、最大、最小

语法格式:

len(参数)

max(参数)

min(参数)

字符都是按一个字节计算,不区分英文和中文

案例:

aa=input(“请输入一句话:”)

print(len(aa))

print(max(aa))

print(min(aa))

七、转义字符

转义字符:改变字符的原始含义

例如:单引号原始含义是代表字符串。加上\表示单引号

print( "nihao'wohao'dgg" )

print( "nihao"wohao"dgg" )

print( "nihao" wohao "dgg" ) 出错

如果字符串中既包含单引号,又包含双引号,须使用转义字符(反斜线“\”)。

如果字符串中包含反斜线,也需要对它进行转义。

在Python中,当我们需要在字符串中使用特殊字符时,用反斜线“\”来转义字符。

 

转义字符描述
\字符串行尾的续行符,即一行未完,转到下一行继续写。
\反斜线
'单引号
"双引号
\n换行符
\r回车符
\f换页
\000
\a蜂鸣器响铃。注意不是喇叭发声,现在的计算机很多都不带蜂鸣器了,所以响铃不一定有效。
\b退格(Backspace)
\t水平制表符/横向制表符,即Tab键,一般相当于四个空格。
\v垂直制表符/纵向制表符
\other其它的字符以普通格式输出

单引号已经作为字符串的定界符了,想要单引号,只能\’

Python支持原始字符串。在原始字符串中,反斜线(“\”)不被当作转义字符,所有的内容都保持“原汁原味”。原始字符串以“r”开头。原始字符串的代码示例:

"C:\Users\jj"

str2 = r"C:\Users\jj"

也可用一对单引号及三个单引号或双引号将字符串括起来

print( "这是一个原始字符串使用的例子:" )

*print(str2)

 

例1:用一句print输出:我是“齐天大圣”孙悟空

print( '我是” 齐天大圣“ \t孙悟空 ' )

我是“齐天大圣” 孙悟空

print('我是”齐天大圣“\n孙悟空')

image.png