两样本假设检验

247 阅读2分钟

1. 两样本假设检验:独立样本

中心极限定理指出,样本均值的分布近似服从正态分布。

假定样本均值的分布服从正态分布,那么两个正态分布的样本均值的差仍然服从正态分布

样本均值差的分布的方差: σX1X22=σ12n1+σ22n2{\sigma}{^2_{\overline{X}_1-\overline{X}_2}} = \frac{{\sigma}{^2_1}}{n_1}+\frac{{\sigma}{^2_2}}{n_2}

两样本均值差的检验—— σ{\sigma}已知:z=X1X2σ12n1+σ22n2z = \frac{{\overline{X}_1-\overline{X}_2}}{\sqrt{\frac{{\sigma}{^2_1}}{n_1}+\frac{{\sigma}{^2_2}}{n_2}}}

应用上式必要的假设条件:

  • 两个样本服从正态分布
  • 两个样本必须是不相关的,即必须是独立的
  • 两个总体的标准差必须是已知的

2. 总体均值的比较:总体标准差未知(合并t检验)

2.1 总体标准差相等

合并方差:sp2=(n11)s12+(n21)s22n1+n22s{^2_p} = \frac{(n_1-1)s{^2_1}+(n_2-1)s{^2_2}}{n_1+n_2-2}

式中,s12s{^2_1} 是第一个样本的方差,s22s{^2_2} 是第二个样本的方差。

在本质上,我们计算的是两个样本标准差的一个加权平均数,并且用这个加权平均数的值作为未知总体标准差的一个估计值。权重是每个样本的自由度。

两样本的均值检验—— σ{\sigma}未知:t=X1X2sp2(1n1+1n2)t = \frac{{\overline{X}_1-\overline{X}_2}}{\sqrt{s{^2_p}(\frac{1}{n_1}+\frac{1}{n_2})}}

检验的自由度是被抽取的样本观测值的总数减去样本的个数。因为有两个样本,所以自由度为 n1+n22n_1+n_2-2

应用上式必要的假设条件:

  • 抽样总体服从正态分布
  • 样本总体是独立的
  • 两个总体的标准差相等

2.2 总体标准差不等

如果总体标准差相等的假定不满足,那么利用与两样本均值差的检验—— σ{\sigma}已知:z=X1X2σ12n1+σ22n2z = \frac{{\overline{X}_1-\overline{X}_2}}{\sqrt{\frac{{\sigma}{^2_1}}{n_1}+\frac{{\sigma}{^2_2}}{n_2}}} 非常相似的统计量。分别用样本标准差 s1s_1s1s_1 替代总体标准差。另外,用一个相当复杂的近似公式对自由度进行调整。调整的作用是减少检验的自由度,于是为了拒绝零假设,将需要一个较大的检验统计量的值。

方差不等时,均值没有差异的检验统计量:t=X1X2s12n1+s22n2t = \frac{{\overline{X}_1-\overline{X}_2}}{\sqrt{\frac{s{^2_1}}{n_1}+\frac{s{^2_2}}{n_2}}}

方差不等检验的自由度:df=[(s12/n1)+(s22/n2)]2(s12/n1)2n11+(s22/n2)2n21df = \frac{{[(s{^2_1}/n_1)+(s{^2_2}/n_2)]}^2}{\frac{(s{^2_1}/n_1)^2}{n_1-1}+\frac{(s{^2_2}/n_2)^2}{n_2-1}}

3. 两样本假设检验:相依样本

成对t检验: t=dsd/nt = \frac{\overline{d}}{s_d/\sqrt{n}}

自由度是n-1

其中,d\overline{d} 是成对或相关观测值之差的均值,sds_d 是成对或相关观测值之差的标准差,n是成对观测值的个数。