你可以使用下面的基本语法,在pandas中使用带有多个聚合的groupby:
df.groupby('team').agg(
mean_points=('points', np.mean),
sum_points=('points', np.sum),
std_points=('points', np.std))
这个特殊的公式通过名为team 的变量对DataFrame的行进行分组,然后计算名为point的变量的几个汇总统计数据。
下面的例子展示了如何在实践中使用这种语法。
例子:在Pandas中使用Groupby与多重聚合
假设我们有如下的pandas DataFrame,其中包含各种篮球运动员的信息:
import pandas as pd
我们可以使用下面的语法将DataFrame的行按球队分组,然后计算每个球队的平均分、总分和标准差:
import numpy as np
#group by team and calculate mean, sum, and standard deviation of points
输出显示每支球队 得分变量的平均值、总和和标准差。
你可以使用类似的语法来执行groupby,并计算你想要的任何数量的聚合。