本文已参与「新人创作礼」活动, 一起开启掘金创作之路。
S: Series I: Index
.capitalize()
S/I
将Series/Index中的字符串大写.cat()
S/I/str
使用给定分隔符连接字符串other=None
None
: 使用sep连接给定的Series返回一个strList_like
: 与Series对应位置的字符串用sep连接返回一个S
sep=None
分隔符na_rep=None
遇到NA值忽略或使用指定字符替换
.center()
S
在字符串两端填充指定字符到指定长度width
填充后的字符串长度fillchar=' '
用于填充的字符串
.contains()
S[bool]
判断指定字符串或正则表达式是否在序列或索引中pat
字符串或正则表达式case=True
是否区分大小写flags=0
可传入re.IGNORECASE之类的参数na=nan
缺失值填充regex=True
是否使用正则表达式匹配
.count()
S[int]
统计指定字符串在序列字符串中出现的次数pat
字符串或正则表达式flags=0
可传入re.IGNORECASE之类的参数
.decode()
S[str]
解码encoding
解码方式errors='static'
error处理方式
.encode()
S[b'']
编码encoding
编码方式error='static'
error处理方式
.endswith()
S[bool]
判断是否以给定的字符串结尾pat
字符串na=nan
缺失值填充
.extract()
pat
正则表达式(必须含有捕获组, 超过一个必然返回DataFrame)flags=0
可传入re.IGNORECASE之类的参数expand=None
True
: 返回DataFrame(未来版本默认值)False
: 返回S/I/DataFrame(现在版本默认值)
.extractall()
df
获取所有的正则表达式匹配到的内容(以多级索引的方式展示)pat
含捕获组的正则表达式, 若捕获组设有name则将作为返回的列标签flags=0
可传入re.IGNORECASE之类的参数
.find()
S
查找sub在序列字符串的子字符串中出现的位置, 找不到返回-1sub
字符串start=0
子字符串开始的位置end=None
子字符串结束的位置
.findall()
S[list]
相当于对序列中每个字符串执行 re.findall(pat, string)pat
正则表达式flags=0
可传入re.IGNORECASE之类的参数
.get()
S
i 获取指定位置的字符, 超出长度则返回Na.index()
S
同.find() 不过找不到将引发Error.join()
S
sep 给每个字符串的字符间插入指定字符.len()
S
返回每个字符串的长度.ljust()
S
同 .center() 不过只在右侧填充.lower()
S
所有字符小写.lstrip()
S
to_strip=None 去除左侧指定字符, 默认去掉空白符.match()
S[bool]
判断字符串与正则表达式是否匹配, 即正则表达式能否匹配到内容pat
字符串或正则表达式case=True
是否区分大小写flags=0
可传入re.IGNORECASE之类的参数na=nan
缺失值填充as_indexer=None
弃用
.normalize()
S
from 返回字符串的Unicode标准格式.pad()
S
在序列字符串左侧/右侧/两侧填充指定字符串到指定长度width
将字符串填充到的长度side='left'
'left'
: 在左侧填充'right'
: 在右侧填充'both'
: 在两侧填充, 原字符串居中
fillchar=' '
填充的字符
.partition()
pat=' '
字符串
expand=True
True: 返回DataFrame/Multilndex
False: 返回Series/Index, 元素为Tuple
.repeat()
repeats
int
: 序列中所有字符串扩展相同倍数list_like
: 长度需和序列长度一致, 对应每个元素扩展对应倍数
.replace()
S
更新字符串pat
字符串或编译的正则表达式repl
str
: 将匹配到的字符串替换为此字符串fun
: 传给fun的是对象相当于re.search(pat, string)的返回值
n=-1
替换的次数, 默认全部case=None
是否区分大小写, 如果pat为字符串则默认为True, 若为编译的正则表达式则不能设置flags=0
可传入re.IGNORECASE之类的参数, 但若pat为编译的正则表达式则不能设置
.rfind()
.rindex()
.rjust()
.rpartition()
.rstrip()
S
to_strip=None 去除右侧指定字符, 默认去掉空白符.slice()
S
截取子字符串start=None
开始位置stop=None
结束位置step=None
步长
.slice_replace()
S
截取子字符串, 并将截取部分替换为replstart=None
开始位置stop=None
结束位置repl=None
要替换为的字符串
.split()
pat=None
分隔符, 默认空白符n=-1
分割次数, 默认全部expand=False
True
: 返回DataFrame/MultiINdexFalse
: 返回Series/Index
.rsplit()
.startswith()
S[bool]
判断序列字符串是否以指定字符串开头pat
字符串
na=nan
缺失值填充
.strip()
S
to_strip=None 去除两侧指定字符, 默认去掉空白符.swapcase()
S
将小写字符大写, 将大写字符小写.title()
S
将首字母大写, 其余字符小写.translate()
.upper()
S
全部大写.wrap()
S
width 在指定位置插入换行符.zfill()
S
width 在字符串前面填充0到指定长度.isalnum()
S[bool]
字符串至少包含一个字符且所有字符都是字母(汉字)或数字则返回True.isalpha()
S[bool]
字符串至少包含一个字符且所有字符都是字母(汉字)则返回True.isdigit()
S[bool]
只包含数字(可以是: Unicode, 全角字符, bytes(b'1'), 罗马数字).isspace()
S[bool]
只包含空白符.islower()
S[bool]
至少包含一个小写字符, 且不包含大写字符.isupper()
S[bool]
至少包含一个大写字符, 且不包含小写字符.istitle()
S[bool]
所有单词大写开头其余小写(标题化).isnumeric()
S[bool]
只包含数字字符.isdecimal()
S[bool]
只包含数字(Unicode字符, 全角字符).get_dummies()
df
sep='|'
把字符串按照指定分隔符分割, 并返回分割后的字符串出现的次数