厘清标准差和标准误：因果推断的统计学基础定义标准差，指一次抽样中个体取值间的离散程度，反映了个体取值对样本均值的

定义

标准差，指 一次抽样中个体取值间的离散程度，反映了 个体取值对样本均值的代表性。

标准误，指 多次抽样中样本均值间的离散程度，反映了 样本均值对总体均值的代表性。

假设总体包含的个体集合是 $x_1,x_2,\ldots,x_N$ 。

对总体抽样m次，每次抽样的样本容量为n，可得下表的m个样本，每个样本，包括n个个体。

表中， $x_{11},x_{12},\ldots,x_{mn}$ ，都是取值自 $x_1,x_2,\ldots,x_N$ 的个体。

问题是，样本均值 v.s. 总体均值，样本标准差 v.s. 总体标准差，有什么关系呢？回答这个问题的依据，就是“中心极限定理”。

中心极限定理：从均值为 $\mu$ 方差为 $\sigma^2$ 的总体中，抽取样本容量为n的样本，当n充分大时，样本均值 $\overline{X}$ 的抽样分布近似服从均值为 $\mu$ 、方差为 $\sigma^{2}/n$ 的正态分布。

注意，上面“中心极限定理”里的总体分布，不一定要求一定是服从正态分布的。总体分布和样本均值抽样分布的关系，可以参考下图。

关于方差分析的内容基本介绍完了，对相关主题感兴趣的读者欢迎留言交流讨论。更多优质内容请欢迎扫码关注瑞行AI：