估计和置信区间

438 阅读1分钟

1. 均值的点估计

点估计:根据样本信息计算的、用于估计总体参数的统计量。

样本均值 X \overline{X} 是总体均值 μ\mu 的一个点估计。
但是,样本均值 X \overline{X} 不是总体参数的唯一一个点估计,例如,样本比例 pp 是总体比例 π\pi 的一个点估计,样本标准差 ss 是总体标准差 σ\sigma 的一个点估计。

2. 总体均值的置信区间

置信区间:根据样本数据构造的一个取值范围,使得总体参数以一个给定的概率出现在这个范围内,给定的概率称作置信水平。

为了计算置信区间,考虑两种情况:

  • 当总体标准差已知时,用样本数据 X \overline{X} 估计 μ\mu
  • 当总体标准差未知时,用样本数据 X \overline{X} 估计 μ\mu 。在这种情况下,用样本标准差 ss 替代总体标准差 σ\sigma

2.1 总体标准差 σ\sigma 已知

σ\sigma 已知时的总体均值的置信区间: X±zσn \overline{X} \pm z\frac{\sigma}{\sqrt{n}}

其中 zz 值依赖于置信水平。常用的置信水平及其对应 zz 值:

置信水平z值
90%1.65
95%1.96
99%2.58

2.2 总体标准差 σ\sigma 未知

t分布

t=Xμs/nt = \frac{\overline{X}-\mu}{s/\sqrt{n}}
式中,ssσ\sigma 的的一个估计量。
t分布比较平坦,比标准正态分布更分散。这是因为t分布的标准差比正态分布的标准差大。

σ\sigma 未知时的总体均值的置信区间

X±tsn \overline{X} \pm t\frac{s}{\sqrt{n}}

3. 比例的置信区间

总体比例的置信区间: p±zp(1p)n p \pm z \sqrt{\frac{p(1-p)}{n}}