方差分析(原理)

216 阅读2分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第2天,点击查看活动详情

总结:此文为12月更文计划第二天第一篇。

方差分析

进行单因素方差分析时,需要得到如图5-1所示的数据结构。

image.png

设xij表示第i个总体的第j个观测值(j = 1,2,…,ni,i = 1,2,…,m),希望由此对不同水平下总体的均值进行比较。

对此,观察到的xij常用以下的模型表示: xij = ui + vij ,1≤j≤ni,1≤i≤m

其中i表示第i个总体的均值,ij为随机误差,在方差分析中为了得到有效的检验法还常假定vij满足:

● uvij为相互独立的;

● vij都服从正态分布,且vij的均值都为0,方差都相同。

当原假设成立时,各总体均值相等,各样本均值间的差异应该较小,模型平方和也应较小,F统计量取很大值应该是稀有的情形。

所以对给定显著性水平α(0, 1),若p = P{F  F0} < α,则拒绝原假设H0(F0为F统计量的观测值),可以认为所考虑的因素对响应变量有显著影响;否则不能拒绝H0,认为所考虑的因素对响应变量无显著影响。

方差分析中常用的基本假定是:

● 正态性:每个总体均服从正态分布,也就是说,对于每一个水平,其观测值是来自正态分布的简单随机样本。

● 方差齐性:各总体的方差相同。

● 独立性:从每一总体中抽取的样本是相互独立的。

在SAS中,正态性可用第3章介绍的方法来验证,也可通过本章介绍的“残差的正态性检验”来验证,方差齐性可以在方差分析的过程进行验证,而独立性可由试验的随机化确定。

方差分析分为:

单因素方差分析

双因素方差分析

并且还有是否有交叉因素。

有交互作用的多因素方差分析

对于有交互作用的观测{xijk},采用以下的模型:

xijk=  + i + j + ij + ijk, 1≤i≤l,1≤j≤m,1≤k≤n

其中表示平均的效应,i和j分别表示因素A的第i个水平和因素B的第j个水平的附加效应,ij表示因素A的第i个水平和因素B的第j个水平交互作用的附加效应。ijk为随机误差,这里也假定它是独立的并且服从等方差的正态分布。

注意,其中n必须大于1,即为了检验交互作用,必须有重复观测。