方差
总体方差
一般的,对一个总体
其中 就是总体的标准差,X为变量值,为总体的均值或数学期望,N为总体的样本数
样本方差
很多情况下,无法取得总体的详细信息,会采用抽样数据来代替或推测总体的参数,对于样本方差有
其中 为样本方差,X为变量,为样本均值,n为样本例数,与总体方差的一个明显的区别是n-1的修正,会有一个自由度的概念,这个有空再写写对它的理解。
协方差
协方差(Covariance)在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。 协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值
标准差
上文中的,和S分别是总体和样本的标准差,就是方差开根号
标准误
标准误(standard error),样本平均数的标准差。用SEx表示。描述样本均值对总体期望值的离散程度。
这个概念非常有意思,在许多检验中用到了,不过大多没有明显的提及。
举例来说:
对一个总体,不管其分布如何,假设其存在一个方差/标准差 和均值。
现在对这个总体进行反复抽样,这里假设每次都进行容量为n的抽样,每次都可以得到一个样本均数 ,反复进行多次后(大于30次),根据中心极限定理,这多个样本均数 必然形成一个正态分布,这个正态分布可以表示为
标准误的值就是
相较于总体,抽样后取了均值,得到的均值离散程度更小更集中,样本内部把离散性互相抵销掉了。