厘清标准差和标准误:因果推断的统计学基础

175 阅读1分钟

定义

标准差,指 一次抽样中 个体取值间的离散程度,反映了 个体取值样本均值的代表性。

标准误,指 多次抽样中 样本均值间的离散程度,反映了 样本均值总体均值的代表性。

公众号原文 厘清标准差和标准误:因果推断的统计学基础

符号语言描述

假设总体包含的个体集合是x1,x2,,xNx_1,x_2,\ldots,x_N

对总体抽样m次,每次抽样的样本容量为n,可得下表的m个样本,每个样本,包括n个个体。

表中,x11,x12,,xmnx_{11},x_{12},\ldots,x_{mn},都是取值自x1,x2,,xNx_1,x_2,\ldots,x_N的个体。

image.png

image.png

公众号原文 厘清标准差和标准误:因果推断的统计学基础

中心极限定理

问题是,样本均值 v.s. 总体均值,样本标准差 v.s. 总体标准差,有什么关系呢?回答这个问题的依据,就是“中心极限定理”。

中心极限定理:从均值为μ\mu方差为σ2\sigma^2的总体中,抽取 样本容量为n的样本,当n充分大时,样本均值X\overline{X}的抽样分布近似服从均值为μ\mu、方差为σ2/n\sigma^{2}/n的正态分布。

注意,上面“中心极限定理”里的总体分布,不一定要求一定是服从正态分布的。总体分布和样本均值抽样分布的关系,可以参考下图。

image.png

关于方差分析的内容基本介绍完了,对相关主题感兴趣的读者欢迎留言交流讨论。更多优质内容请欢迎扫码关注 瑞行AI:

image.png