精选100个Pandas函数

192 阅读3分钟

公众号:尤而小屋
作者:Peter
编辑:Peter

大家好,我是Peter~

精心整理100个pandas常用的函数,建议收藏备用,绝对用得上~

a

aggregate()  #聚合;基于内置函数或者自定义函数的聚合运算
argmin()  最小值所在的索引
argmax()  最大值所在的索引
any()  等价于逻辑“或”
all()  等价于逻辑“与”
astype()  强制类型转换
apply()  # 自定义函数的元素操作
append()  序列元素的追加
assign()  字段衍生

b

bfill()   # 后向填充;使用缺失值后一个填充缺失值
between()  区间判断

c

count()  # 计数(不包含缺失值)
cov()   计算协方差
corr()  # 计算相关系数
cumsum()  累计和
cumprod()   累计积
compress  条件判断
concat()  # 数据合并

d

dtypes()  查看数据字段类型
describe()   # 描述统计信息
duplicated()   判断是否有重复元素
drop_duplicates()  #删除重复值
dropna()  # 删除缺失值
diff()  一阶差分
dt.date()   提取日期
dt.time()   提取时间
dt.year()   提取年份
dt.month()  提取年份
dt.day()    提取天/日
dt.hour()   提取小时
dt.minute()   提取分
dt.second()  提取秒
dt.quarter()  提取季度
dt.weekday()  # 提取星期几(返回数值,0,1,2.....)
dt.weeky_name()  # 提取星期几(返回名称,Sunday,Friday等)
dt.week()  返回当年的第几周
dt.dayofyear()   返回年中的第几天
dt.daysinmonth()  月中最大的天数
dt.is_month_start()  是否为当月的第一天
dt.is_month_end()  是否为当月的最后裔天
dt.is_quarter_start()  是否为季度的第一天
dt.is_quarter_end()  是否为季度的最后一天
dt.is_year_start()  是否为当年的第一天
dt.is_year_end()   是否为当年的最后一天
dt.is_leap_year()  # 判断是否为闰年

e

explode()  # 爆炸函数

f

fillna()   填充缺失值
ffill()   # 前向填充;使用前一个值填充缺失值
factorize()  因子化转换

g

groupby()  # 分组
get_dummies()  # 哑变量

h

hist()   绘制直方图
hasnans()  判断元素中是否存在缺失值;返回的是True或者False

i

isnull()   # 判断序列元素是否为缺失值,返回bool值
isin()   成员判断
iloc()  # 定位数据;只能使用数值 

j

join()  # 数据合并

k

kurt()  计算峰度

l

loc()   # 定位数据

m

min()  最小值
max()  最大值
mean()  均值
median()  中位数
mode()  众数
map()   # 元素映射
merge()  # 合并数据

n

notnull()    非空判断
nsmallest()  最小的前n个值
nlargest()   最大的前n个值

p

pct_change   运算比率;后一个和前一个的比例
pd.to_datetime()  转日期时间类型
pd.Series()  # 创建Series数据
pd.DataFrame()  # 创建DataFrame数据
plot()  绘制基于Kind参数的多种图形;kind指定图形类型:饼图、柱状图、箱型图等

q

quantile()  分位数

r

replace()   替换值(不能使用正则)
str.replace()  值替换(可使用正则)
round()   四舍五入
read_csv()   # 读取csv文件
read_excel()  # 读取Excel文件
read_table()  # 读取table文件
rank()  # 排名

s

sum()  求和
size()  计数(包含所有数据,包含空值)
std()  计算标准差
skew()  计算偏度
sample()  抽样
str.split()  字符分割
str.findall()  
sort_values()  # 按值排序
sort_index()  按索引排序
stack()  # 堆叠;列转行

t

to_dict()  转为字典
tolist()  转为列表
transpose  .T  # 转置

u

unique()  元素唯一值(去重)
unstack  # 不要堆叠,多行转列

v

var()  计算方差
value_counts()  # 统计每个元素的值

w

where()    # 基于条件判断的值替换