Pandas:基本统计分析

687 阅读1分钟

基本统计分析又叫描述性统计分析,一般统计某个变量的最小值,第一个四分位值,中值,第三个四分位值以及最大值。

描述性统计分析函数为describe,该函数返回值有均值,标准差,最大值,最小值,分位数等。括号中可以带一些参数,如percentitles=[0.2,0.4,0.6,0.8]就是指定只计算0.2, 0.6, 0.8 分位数,而不是默认的1/4, 1/2, 3/4分位数。

  • describe() 1. mean : 均值 2. median: 中位数 3. mode: 众数 4. count: 计数 5. std: 标准差

常用的统计函数有:

  • size: 计数(此函数不需要括号)
  • sum(): 求和
  • mean(): 平均值
  • var(): 方差
  • std(): 标准差
import pandas as pd

df = pd.read_excel(r'/pylearn/examples/i_nuc.xls', sheet_name='Sheet7')
print(df)

print(df.数分.describe()) #查看 数分 列 的基本统计

print(df.describe()) # 查 各列 的基本统计

print(df.解几.size) #
print("最大值", df['解几'].max()) #
print("最小值",df['解几'].min()) #
print("求总和",df['解几'].sum()) #
print("求均值",df['解几'].mean()) #
print("求方差",df['解几'].var()) #
print("标准差",df['解几'].std()) #


"""
    Numpy数组也可以使用mean函数计算样本均值,也可以使用average函数计算加权的样本均值

"""

#用mean函数计算“数分“的平均函数

import numpy as np

print(np.mean(df['数分']))

#还可以使用average函数计算“数分“的平均成绩
print(np.average(df['数分']))


#也可以使用pandas的DataFrame对象的mean方法求均值。
print(df['数分'].mean())

#计算中位数
print(df.median())

"""
 对于定性数据来说,众数是出现次数最多的值,使用mode()计算众数。
"""
print(df.mode())