1 总体与样本
- 总体可以认为是要研究的对象全体,可以是全部人类,也可以是一个班级里的同学,也可以是全校学生某次考试的数学成绩。
- 样本 在一些情况下,总体的数据可能无法取到,比如全部中国人的身高,这时为了估计这个身高值,只能抽取部分对象进行统计,这抽取的部分可以称之为样本。
2 参数估计
参数估计(parameter estimation),统计推断的一种。根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。从估计形式看,区分为点估计与区间估计:从构造估计量的方法讲,有矩法估计、最小二乘估计、似然估计、贝叶斯估计等。要处理两个问题:(1)求出未知参数的估计量;(2)在一定信度(可靠程度)下指出所求的估计量的精度。信度一般用概率表示,如可信程度为95%;精度用估计量与被估参数(或待估参数)之间的接近程度或误差来度量。 以上例身高为例,抽取了100人,量了下身高,得出平均身高168CM,那么就大致认为全体中国人的平均身高为168CM,这可以称之为点估计;如果根据正态分布或t分布,得出中国人平均身高有95%是在160-176之间,这就是区间估计。
3 均值与方差
- 均值就是总体或样本的算术平均值,一般可以用 来表示 一般读作 "x bar"
- 方差