机器学习概论

60 阅读1分钟

机器学习第一天

主要学习了周志华老师的机器学习的视频:www.xuetangx.com/learn/nju08…

感觉周志华老师讲授的内容通俗易懂,对于新人入门十分友好。

概论

听完了概论部分的课程,主要心得有以下几点:

  1. 对于计算机而言,数据即为经验
  2. 因为过拟合的原因,所以不存在完美的算法,只能做到近似正确
  3. 机器学习是一种面对不确定性问题设计出来的学科
  4. 机器学习的过程,主要是从数据中提取偏好,任何一个有效机器学习必然存在偏好
  5. 无法脱离具体问题,讨论模型的好坏

模型的评估与选择

主要的三个问题

评估方法——划分测试集

  1. 留出法:多次重复划分
  2. 交叉验证法:确保可以把每个数据都能测试一遍
  3. 自助法:可放回的抽取,适用于数据短缺的情况

注:在调参过程中,用到的验证集主要来自于训练集

性能度量——评估模型优劣

  1. 回归:均方误差
  2. 分类:F1

比较检验——判断实质差别

对于性能度量之后的模型,我们仍然很难判断它一定好或者一定差,所以我们采用假设检验的方法,进一步确定它是否好或者坏。