Pandas 描述和汇总统计函数

166 阅读1分钟
方法说明
count非 NA 值的数量
describe针对 Series 或各 DataFrame 列计算汇总统计
min, max计算最小值和最大值
argmin, argmax计算能够获取到最小值和最大值的索引位置(整数)
idxmin, idxmax计算能够获取到最小值和最大值的索引值
quantile计算样本的分位数(0到1)
sum值的总和
mean值的平均数
median值的算术中位数(50%分位数)
mad根据平均值计算平均绝对离差
var样本值的方差
std样本值的标准差
skew样本值的偏度(三阶矩)
kurt样本值的峰度(四阶矩)
cumsum样本值的累计和
cummin, cummax样本值的累计最大值和累计最小值
cumprod样本值的累计积
diff计算一阶差分(对时间序列很有用)
pct_change计算百分数变化

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

以上摘自《利用 Python 进行数据分析》