了解方差分析模型的无效假设

394 阅读4分钟

单向方差分析用于确定三个或更多独立小组的平均值之间是否存在统计学上的显著差异。

单向方差分析使用以下无效假设和备选假设。

  • H0:μ1=μ2=μ3=...=μk(所有组的平均值都相等)
  • HA:至少有一个组的平均值与其他组不同

为了决定我们是否应该拒绝或不能拒绝无效假设,我们必须参考方差分析表输出中的p值。

如果p值小于某个显著性水平(如0.05),那么我们就可以拒绝无效假设,并得出结论说并非所有组的平均值都相等。

双向方差分析用于确定在两个变量(有时称为 "因子")上被分割的三个或更多独立组的平均值之间是否存在统计学上的显著差异。

双向方差分析同时检验三个无效假设。

  • 所有组的平均值在第一个变量的每个水平上都是相等的
  • 所有组的平均值在第二个变量的每个水平上都是相等的
  • 两个变量之间不存在交互作用。

为了决定我们是否应该拒绝或不拒绝每个无效假设,我们必须参考双向方差分析表输出中的p值。

下面的例子说明了在单向方差分析和双向方差分析中如何决定拒绝或不拒绝无效假设。

例1:单程方差分析

假设我们想知道三种不同的考试准备方案是否会导致某次考试的平均分数不同。为了验证这一点,我们招募了30名学生参加研究,并将他们分成三组。

每组的学生被随机分配到三个备考方案中的一个,在接下来的三周内为考试做准备。在这三周结束时,所有的学生都参加同一考试。

每组的考试成绩如下。

Example one-way ANOVA data

当我们将这些数值输入单因素方差分析计算器时,我们得到以下方差分析表作为输出。

ANOVA output table interpretation

请注意,P值为0.11385

对于这个特殊的例子,我们将使用以下的无效假设和备选假设。

  • H0: μ1= μ2= μ3 (每组的平均考试分数相等)
  • HA:至少有一个组的平均分与其他组不同

由于方差分析表中的P值不小于0.05,我们未能拒绝无效假设。

这意味着我们没有足够的证据说三组的平均考试成绩之间存在统计学上的显著差异。

例2:两路方差分析

假设一位植物学家想知道植物的生长是否受到阳光照射和浇水频率的影响。

她种植了40颗种子,让它们在不同的阳光照射和浇水频率条件下生长了两个月。两个月后,她记录了每株植物的高度。结果显示如下。

Two-way ANOVA table in Excel

在上表中,我们看到在每种条件组合下都有五株植物生长。

例如,有五株植物在每天浇水和没有阳光的情况下生长,两个月后的高度分别为4.8英寸、4.4英寸、3.2英寸、3.9英寸和4.4英寸。

Two-way ANOVA data in Excel

在Excel中进行了双向方差分析,最后的输出结果如下。

我们可以在双向方差分析表的输出中看到以下p值。

  • 浇水频率的p值是0.975975。这在0.05的显著性水平上没有统计学意义。
  • 阳光照射的p值是3.9E-8(0.000000039)。这在0.05的显著性水平上是有统计学意义的。
  • 浇水频率和阳光照射之间的交互作用的P值是0.310898。这在0.05的显著性水平上没有统计学意义。

这些结果表明,阳光照射是唯一对植物高度有统计学上显著影响的因素。

而且由于没有交互作用,阳光照射的影响在每一级浇水频率中是一致的。

也就是说,植物是每天浇水还是每周浇水,对阳光照射对植物的影响没有影响。