许多统计测试都假设数据集中的数值是正态分布。
检验这一假设的最简单方法之一是进行Jarque-Bera检验,这是一种拟合度检验,确定样本数据的偏度和峰度是否符合正态分布。
这个测试使用以下假设。
- H0:数据是正态分布。
- HA:数据不是正态分布。
检验统计量JB定义为。
JB=(n/6)*(S2+(C2/4))。
其中。
- n:样本中观测值的数量
- S:样本的偏度
- C:样本的峰度
在正态性的无效假设下,JB ~X2(2)。
如果与检验统计量相对应的P值小于某个显著性水平(例如,α=0.05),那么我们就可以拒绝零假设,并得出数据不是正态分布的结论。
本教程提供了一个循序渐进的例子,说明如何在Google Sheets中对一个给定的数据集进行Jarque-Bera检验。
第1步:输入数据
首先,让我们创建一个有15个值的假数据集。

第2步:计算测试统计量
接下来,我们将计算JB测试统计量。
E列显示了所使用的公式。

检验统计量结果是1.0175。
第三步:计算P值
在正态性的无效假设下,测试统计量JB遵循自由度为2的奇异分布。
因此,为了找到测试的P值,我们将使用以下公式。
=CHISQ.DIST.RT(JB测试统计量,2)
下面的屏幕截图显示了如何在实践中使用这个公式。

检验的P值是0.601244。
回顾一下,这个Jarque-Bera正态性检验使用了以下假设。
- H0:数据是正态分布。
- HA:数据不是正态分布。
由于这个P值不小于0.05,我们未能拒绝无效假设。
这意味着我们没有足够的证据说数据集不是正态分布。
换句话说,我们可以假设数据是正态分布。