统计学基础知识

171 阅读1分钟

1 总体与样本

  • 总体可以认为是要研究的对象全体,可以是全部人类,也可以是一个班级里的同学,也可以是全校学生某次考试的数学成绩。
  • 样本 在一些情况下,总体的数据可能无法取到,比如全部中国人的身高,这时为了估计这个身高值,只能抽取部分对象进行统计,这抽取的部分可以称之为样本。

2 参数估计

参数估计(parameter estimation),统计推断的一种。根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。从估计形式看,区分为点估计与区间估计:从构造估计量的方法讲,有矩法估计、最小二乘估计、似然估计、贝叶斯估计等。要处理两个问题:(1)求出未知参数的估计量;(2)在一定信度(可靠程度)下指出所求的估计量的精度。信度一般用概率表示,如可信程度为95%;精度用估计量与被估参数(或待估参数)之间的接近程度或误差来度量。 以上例身高为例,抽取了100人,量了下身高,得出平均身高168CM,那么就大致认为全体中国人的平均身高为168CM,这可以称之为点估计;如果根据正态分布或t分布,得出中国人平均身高有95%是在160-176之间,这就是区间估计。

3 均值与方差

  • 均值就是总体或样本的算术平均值,一般可以用 xˉ\bar x 来表示 一般读作 "x bar"
  • 方差 σ2=i=1k(xixˉ)2k\sigma^2=\sum _{i=1}^{k} \frac{(x_i-\bar x)^2}k