如何在谷歌表格中进行正态性测试

496 阅读2分钟

许多统计测试都假设数据集中的数值是正态分布

检验这一假设的最简单方法之一是进行Jarque-Bera检验,这是一种拟合度检验,确定样本数据的偏度和峰度是否符合正态分布。

这个测试使用以下假设。

  • H0:数据是正态分布。
  • HA:数据不是正态分布。

检验统计量JB定义为。

JB=(n/6)*(S2+(C2/4))。

其中。

  • n:样本中观测值的数量
  • S:样本的偏度
  • C:样本的峰度

在正态性的无效假设下,JB ~X2(2)。

如果与检验统计量相对应的P值小于某个显著性水平(例如,α=0.05),那么我们就可以拒绝零假设,并得出数据不是正态分布的结论。

本教程提供了一个循序渐进的例子,说明如何在Google Sheets中对一个给定的数据集进行Jarque-Bera检验。

第1步:输入数据

首先,让我们创建一个有15个值的假数据集。

第2步:计算测试统计量

接下来,我们将计算JB测试统计量。

E列显示了所使用的公式。

检验统计量结果是1.0175

第三步:计算P值

在正态性的无效假设下,测试统计量JB遵循自由度为2的奇异分布。

因此,为了找到测试的P值,我们将使用以下公式。

=CHISQ.DIST.RT(JB测试统计量,2)

下面的屏幕截图显示了如何在实践中使用这个公式。

normality test in Google Sheets

检验的P值是0.601244

回顾一下,这个Jarque-Bera正态性检验使用了以下假设。

  • H0:数据是正态分布。
  • HA:数据不是正态分布。

由于这个P值不小于0.05,我们未能拒绝无效假设。

这意味着我们没有足够的证据说数据集不是正态分布。

换句话说,我们可以假设数据是正态分布。