ANOVA("方差分析")是一种模型,用于确定三个或更多独立组的平均值之间是否存在显著差异。
每当我们对数据集进行方差分析模型时,总会出现残差--这些残差代表了每个单独的观察值与该观察值所在组的平均值之间的差异。
下面的例子显示了如何在实践中计算方差分析模型的残差。
例子:计算方差分析的残差
假设我们招募了90人参加一个减肥实验,其中我们随机分配了30人跟随方案A、方案B或方案C一个月。
我们可以进行单因素方差分析,以确定三个方案所产生的减肥效果之间是否存在统计学上的显著差异。
假设我们计算出每个方案中个人的平均减重为:
- 方案A:1.58磅
- 方案B:2.56磅
- 计划C:4.13磅
方差分析模型的残差将是每个人的减重与他们项目中的平均减重之间的差异。
例如,下表中显示了如何计算研究中10个不同个体的残差。
注意下面的模式:
- 数值大于其小组平均数的个人有一个正的残差
- 残差值小于群体平均数的个体,其残差值为负
在实践中,我们会计算所有90人的残差。
如何使用残差来检查正常性
方差分析的假设之一是,残差是正态分布。
检查这一假设的最常用方法是创建Q-Q图。
如果残差是正态分布,那么Q-Q图中的点将位于一条直线上。
下面是我们之前的例子中Q-Q图的样子:
这些点在尾部有点偏离直线对角线,但总的来说,这些点都很好地沿着对角线下落。 这告诉我们,正态性假设很可能得到满足。
作为参考,下面是非正态分布的残差的Q-Q图可能是这样的。
这些点疯狂地偏离了直线对角线,这表明残差不是正态分布。
请参考以下教程,学习如何在不同的软件中创建Q-Q图:
其他资源
以下文章提供了关于方差分析模型的额外信息: