机器学习 | 欠拟合&过拟合

63 阅读1分钟

炼丹的三种情况

  • Under fitting 欠拟合
  • Over fitting 过拟合
  • Appropriate fitting 我的理想型

image.png

欠拟合 under fitting 【小白】

模型可能还是太简单,不具备学习数据中关键特征和模式,进而在train dataset和test dataset都变现worse

  1. 怎么发现:训练集上worse,测试集上worse,根本没学到东西,或学的还不够
  2. 解决办法:
    • 数据集:可能是数据集规模不够的问题,如果可以的话增加数据集的规模
    • 复杂度:使用更复杂的模型、增加更多的特征、减小正则化强度
    • 超参数:可能自己的超参数选的不好

过拟合 over fitting 【灌水】

模型强到了已经记住了训练集中犄角旮旯的细节完美区分数据,但是其学习得不是“通用模式”,平时表现看着贼完美,一考试上测试集,表现很差

  1. 怎么发现:训练集上ok,测试集上worse,记忆住了训练数据
  2. 解决办法:
    • 数据集:数据集扩增
    • 复杂度:正则化、特征选择
    • 早停法:训练模型时,监控其在测试集上的性能,一旦开始下降,则立即停止training,以防止继续训练模型记住了数据,造成over fitting
    • 超参数:可能自己的超参数选的不好

Link

详解过拟合和欠拟合! (qq.com)