方差分析（原理）**开启掘金成长之旅！这是我参与「掘金日新计划 · 12 月更文挑战」的第2天，点击查看活动详情总结：

开启掘金成长之旅！这是我参与「掘金日新计划 · 12 月更文挑战」的第2天，点击查看活动详情

总结：此文为12月更文计划第二天第一篇。

方差分析

进行单因素方差分析时，需要得到如图5-1所示的数据结构。

设xij表示第i个总体的第j个观测值（j = 1，2，…，ni，i = 1，2，…，m），希望由此对不同水平下总体的均值进行比较。

对此，观察到的xij常用以下的模型表示： xij = ui + vij ，1≤j≤ni，1≤i≤m

其中i表示第i个总体的均值，ij为随机误差，在方差分析中为了得到有效的检验法还常假定vij满足：

● uvij为相互独立的；

● vij都服从正态分布，且vij的均值都为0，方差都相同。

当原假设成立时，各总体均值相等，各样本均值间的差异应该较小，模型平方和也应较小，F统计量取很大值应该是稀有的情形。

所以对给定显著性水平α(0, 1)，若p = P{F  F0} < α，则拒绝原假设H0（F0为F统计量的观测值），可以认为所考虑的因素对响应变量有显著影响；否则不能拒绝H0，认为所考虑的因素对响应变量无显著影响。

方差分析中常用的基本假定是：

● 正态性：每个总体均服从正态分布，也就是说，对于每一个水平，其观测值是来自正态分布的简单随机样本。

● 方差齐性：各总体的方差相同。

● 独立性：从每一总体中抽取的样本是相互独立的。

在SAS中，正态性可用第3章介绍的方法来验证，也可通过本章介绍的“残差的正态性检验”来验证，方差齐性可以在方差分析的过程进行验证，而独立性可由试验的随机化确定。

方差分析分为：

单因素方差分析

双因素方差分析

并且还有是否有交叉因素。

有交互作用的多因素方差分析

对于有交互作用的观测{xijk}，采用以下的模型：

xijk=  + i + j + ij + ijk， 1≤i≤l，1≤j≤m，1≤k≤n

其中表示平均的效应，i和j分别表示因素A的第i个水平和因素B的第j个水平的附加效应，ij表示因素A的第i个水平和因素B的第j个水平交互作用的附加效应。ijk为随机误差，这里也假定它是独立的并且服从等方差的正态分布。

注意，其中n必须大于1，即为了检验交互作用，必须有重复观测。