深度学习(二)bias和variance

233 阅读1分钟

本节课程链接

机器学习中的误差主要来源有两种:
biasvariance
在这里插入图片描述
当模型复杂度低时,bias大variance小
当模型复杂度高时,bias小variance大
这也是欠拟合与过拟合的一种表现形式
在这里插入图片描述
进行非常大量的实验后,得到了模型的平均值(蓝线),真值为黑线,可以看到五次的模型bias明显小于一次模型。
在这里插入图片描述

bias大怎么办

在这里插入图片描述
引入更多的特征因素,重新构造更复杂的模型

variance大怎么办

在这里插入图片描述
可以使用更多的训练数据,但是训练数据有时并不容易获取,这时可以进行正则化。不过正则化会一程度上增大bias。

不建议根据测试数据的误差对原模型再进行修改,因为这样做会引入测试数据的bias。

为了得到最好的模型,可以将训练数据分成N份,进行N次验证,每次将其中一份作为验证数据,其余作为训练数据。这种方式称为N折交叉验证
在这里插入图片描述