偏差和方差

394 阅读2分钟

偏差(Bias) 反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度 方差(Variance) 反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。 高偏差导致欠拟合(underfitting) 高方差导致过拟合(overfitting) 直白说就是:bias是偏差,偏置,强调偏离,模型的预测值和真实数据离得老远,离谱的拟合结果,就是欠拟合 而方差则是输出的值互相离得老远,逐渐离谱,就是把数据全拟合上了,但是曲线贼离谱复杂,就是过拟合 请添加图片描述 方差 方差是衡量随机变量或一组数据时离散程度的度量。方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是各个样本数据和平均数之差的平方和的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。

对于一组随机变量或者统计数据,其期望值(平均数)用E ( X ) E(X)E(X)​表示,即随机变量或统计数据的均值, 方差的公式如下所示(对各个数据与均值的差的平方和再求平均数): ———————————————— 有了方差为什么还需要标准差? 可以看到标准差的概念是基于方差的,仅仅是求了一个平方根而已。那么为什么要造出标准差这样一个概念呢?

简单来说,方差单位和数据的单位不一致,没法使用,虽然能很好的描述数据与均值的偏离程度,但是处理结果是不符合我们的直观思维的。

而标准差和数据的单位一致,使用起来方便。内在原因就是方差开了一个平方,而标准差通过加了一个根号使得和均值的量纲(单位)保持了一致,在描述一个波动范围时标准差比方差更方便。 ———————————————