如何在Pandas中使用Groupby与多个聚合的方法

425 阅读1分钟

你可以使用下面的基本语法,在pandas中使用带有多个聚合的groupby:

df.groupby('team').agg(
    mean_points=('points', np.mean),
    sum_points=('points', np.sum),
    std_points=('points', np.std))

这个特殊的公式通过名为team 的变量对DataFrame的行进行分组,然后计算名为point的变量的几个汇总统计数据。

下面的例子展示了如何在实践中使用这种语法。

例子:在Pandas中使用Groupby与多重聚合

假设我们有如下的pandas DataFrame,其中包含各种篮球运动员的信息:

import pandas as pd


我们可以使用下面的语法将DataFrame的行按球队分组,然后计算每个球队的平均分、总分和标准差:

import numpy as np

#group by team and calculate mean, sum, and standard deviation of points

输出显示每支球队 得分变量的平均值、总和和标准差。

你可以使用类似的语法来执行groupby,并计算你想要的任何数量的聚合。