Python数据分析-pandas-数据运算
统计
求和
sum()函数对数据表的每一列数据分别进行求和
import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=0)
print(a)
print('--------------')
a = a.sum()
print(a)
单独对某一列进行求和
import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=0)
print(a)
print('--------------')
a = a['学费'].sum()
print(a)
求平均值
mean()函数可以对数据表的所有数值数据列分别计算平均值
import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=2)
print(a)
print('--------------')
b = a.mean()
print(b)
print('--------------')
c = a['学费'].mean()
print(c)
求最值
max()函数可以统计每一列数据的最大值
min()函数可以统计每一列数据的最小值
import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=2)
print(a)
print('--------------')
b = a.max()
b2 = a['学费'].max()
print(b)
print(b2)
print('--------------')
c = a.min()
c2 = a['学费'].min()
print(c)
print(c2)
分组汇总
pandas模块中的groupby()函数可以对数据进行分组
import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=2)
print(a)
print('--------------')
b = a.groupby('班级').sum()
//依据“班级”列对数据进行分组,再对分组后的数据分别进行求和运算
print(b)
print('--------------')
c = a.groupby('班级')['学费'].sum()
print(c)
创建数据透视表
pandas模块中的pivot_table()函数可以制作数据透视表
import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=2)
print(a)
print('--------------')
b = pd.pivot_table(a,values='学费',index='班级',aggfunc='sum')
print(b)
print('--------------')
c = pd.pivot_table(a,values=['学费','人数'],index='班级',aggfunc='sum')
print(c)
计算相关系数
pandas模块中的corr()函数可以计算相关系数
import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=2)
print(a)
print('--------------')
b = a.corr()
print(b)
print('--------------')
c = a.corr()['学费']
print(c)
获取数值分布
describe()函数可以按列获取数据表中所有数值数据的分布情况
import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=2)
print(a)
print('--------------')
b = a.describe()
print(b)
print('--------------')
c = a['学费'].describe()
print(c)