Python数据分析-pandas-数据运算

274 阅读2分钟

Python数据分析-pandas-数据运算

统计

求和

sum()函数对数据表的每一列数据分别进行求和

import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=0)
print(a)
print('--------------')
a = a.sum()
print(a)

在这里插入图片描述
单独对某一列进行求和

import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=0)
print(a)
print('--------------')
a = a['学费'].sum()
print(a)

在这里插入图片描述

求平均值

mean()函数可以对数据表的所有数值数据列分别计算平均值

import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=2)
print(a)
print('--------------')
b = a.mean()
print(b)
print('--------------')
c = a['学费'].mean()
print(c)

在这里插入图片描述

求最值

max()函数可以统计每一列数据的最大值
min()函数可以统计每一列数据的最小值

import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=2)
print(a)
print('--------------')
b = a.max()
b2 = a['学费'].max()
print(b)
print(b2)
print('--------------')
c = a.min()
c2 = a['学费'].min()
print(c)
print(c2)

在这里插入图片描述

分组汇总

pandas模块中的groupby()函数可以对数据进行分组

import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=2)
print(a)
print('--------------')
b = a.groupby('班级').sum()
//依据“班级”列对数据进行分组,再对分组后的数据分别进行求和运算
print(b)
print('--------------')
c = a.groupby('班级')['学费'].sum()
print(c)

在这里插入图片描述

创建数据透视表

pandas模块中的pivot_table()函数可以制作数据透视表

import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=2)
print(a)
print('--------------')
b = pd.pivot_table(a,values='学费',index='班级',aggfunc='sum')
print(b)
print('--------------')
c = pd.pivot_table(a,values=['学费','人数'],index='班级',aggfunc='sum')
print(c)

在这里插入图片描述

计算相关系数

pandas模块中的corr()函数可以计算相关系数

import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=2)
print(a)
print('--------------')
b = a.corr()
print(b)
print('--------------')
c = a.corr()['学费']
print(c)

在这里插入图片描述

获取数值分布

describe()函数可以按列获取数据表中所有数值数据的分布情况

import pandas as pd
a = pd.read_excel('test.xlsx',sheet_name=2)
print(a)
print('--------------')
b = a.describe()
print(b)
print('--------------')
c = a['学费'].describe()
print(c)

在这里插入图片描述