在统计学中,我们经常从人口中抽取样本,并使用样本中的数据来得出关于整个人口的结论。
一种常用的抽样方法是聚类抽样,在这种方法中,人口被分成若干个聚类,一些聚类的所有成员都被选入样本中。
下面的例子说明了如何在Excel中进行聚类抽样。
第一步:输入数据
首先,让我们在Excel中输入以下数据集:

接下来,我们将进行聚类抽样,随机选择两支球队,并选择将这两支球队的每个球员都纳入最终的样本中。
第二步:寻找唯一值
接下来,输入=UNIQUE(B2:B21),从球队**列中产生一个唯一值数组:

接下来,我们将在每个独特的球队名称旁边输入一个整数(从1开始)。

第3步:选择随机群组
接下来,我们将输入=RANDBETWEEN(G2, G6)来随机选择列表中的一个整数:

一旦我们点击 ENTER,我们就可以看到,数值5被随机选中。与这个值相关的球队是E队,它代表了我们将包括在最终样本中的第一个球队。

接下来,双击任何单元格并按下回车键。一个新的数字将从**=RANDBETWEEN(G2, G6)**函数中选出。

我们可以看到,3这个值是随机选择的。与这个数值相关的球队是C队,它代表了我们将在最终样本中包括的第二个球队。
第4步:过滤最终样本
最后的样本将简单地包括所有属于C队或E队的球员。
要想只过滤这些球员,请选中所有的数据。然后点击顶部功能区的数据标签,再点击排序和过滤组中的过滤按钮。
当过滤器出现在每一列上面时,点击球队列旁边的下拉箭头,只勾选球队C和E旁边的方框。

一旦你点击确定,数据集将被过滤为只显示C队或E队的球员。

这代表我们的最终样本。
我们的聚类抽样是完整的,因为我们随机选择了两支球队,并将这两支球队的每个球员都纳入我们的最终样本。
其他资源
下面的教程解释了如何使用Excel从人口中选择其他类型的样本: