机器学习第一天
主要学习了周志华老师的机器学习的视频:www.xuetangx.com/learn/nju08…
感觉周志华老师讲授的内容通俗易懂,对于新人入门十分友好。
概论
听完了概论部分的课程,主要心得有以下几点:
- 对于计算机而言,数据即为经验
- 因为过拟合的原因,所以不存在完美的算法,只能做到近似正确
- 机器学习是一种面对不确定性问题设计出来的学科
- 机器学习的过程,主要是从数据中提取偏好,任何一个有效机器学习必然存在偏好
- 无法脱离具体问题,讨论模型的好坏
模型的评估与选择
主要的三个问题
评估方法——划分测试集
- 留出法:多次重复划分
- 交叉验证法:确保可以把每个数据都能测试一遍
- 自助法:可放回的抽取,适用于数据短缺的情况
注:在调参过程中,用到的验证集主要来自于训练集
性能度量——评估模型优劣
- 回归:均方误差
- 分类:F1
比较检验——判断实质差别
对于性能度量之后的模型,我们仍然很难判断它一定好或者一定差,所以我们采用假设检验的方法,进一步确定它是否好或者坏。