方差标准差及协方差和标准误方差总体方差一般的,对一个总体 $$ \sigma^2=\sum_{i=1}^{N}\fr

方差

总体方差

一般的,对一个总体

\sigma^2=\sum_{i=1}^{N}\frac{(X-\mu)^2}{N}

其中 $\sigma^2$ 就是总体的标准差，X为变量值, $\mu$ 为总体的均值或数学期望，N为总体的样本数

样本方差

很多情况下，无法取得总体的详细信息，会采用抽样数据来代替或推测总体的参数，对于样本方差有

S^2=\sum_{i=1}^{n}\frac{(X-\bar X)^2}{n-1}

其中 $S^2$ 为样本方差，X为变量， $\bar X$ 为样本均值，n为样本例数,与总体方差的一个明显的区别是n-1的修正，会有一个自由度的概念，这个有空再写写对它的理解。

协方差

协方差（Covariance）在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况，即当两个变量是相同的情况。协方差表示的是两个变量的总体的误差，这与只表示一个变量误差的方差不同。如果两个变量的变化趋势一致，也就是说如果其中一个大于自身的期望值，另外一个也大于自身的期望值，那么两个变量之间的协方差就是正值。如果两个变量的变化趋势相反，即其中一个大于自身的期望值，另外一个却小于自身的期望值，那么两个变量之间的协方差就是负值

标准差

上文中的， $\sigma$ 和S分别是总体和样本的标准差，就是方差开根号

标准误

标准误（standard error），样本平均数的标准差。用SEx表示。描述样本均值对总体期望值的离散程度。这个概念非常有意思，在许多检验中用到了，不过大多没有明显的提及。
举例来说：对一个总体，不管其分布如何，假设其存在一个方差/标准差 $\sigma^2$ 和均值 $\mu$ 。
现在对这个总体进行反复抽样，这里假设每次都进行容量为n的抽样，每次都可以得到一个样本均数 $\bar X$ ，反复进行多次后（大于30次），根据中心极限定理，这多个样本均数 $\bar X$ 必然形成一个正态分布 $N_s$ ，这个正态分布可以表示为

$N_s \sim N(\mu, \frac{\sigma^2}{n})$

标准误的值就是 $\frac{\sigma}{\sqrt n}$

相较于总体，抽样后取了均值，得到的均值离散程度更小更集中，样本内部把离散性互相抵销掉了。