机器学习概论

展信佳_daydayup

2025-06-10 60 阅读1分钟

机器学习第一天

主要学习了周志华老师的机器学习的视频：www.xuetangx.com/learn/nju08…

感觉周志华老师讲授的内容通俗易懂，对于新人入门十分友好。

概论

听完了概论部分的课程，主要心得有以下几点：

对于计算机而言，数据即为经验
因为过拟合的原因，所以不存在完美的算法，只能做到近似正确
机器学习是一种面对不确定性问题设计出来的学科
机器学习的过程，主要是从数据中提取偏好，任何一个有效机器学习必然存在偏好
无法脱离具体问题，讨论模型的好坏

模型的评估与选择

主要的三个问题

评估方法——划分测试集

留出法：多次重复划分
交叉验证法：确保可以把每个数据都能测试一遍
自助法：可放回的抽取，适用于数据短缺的情况

注:在调参过程中,用到的验证集主要来自于训练集

性能度量——评估模型优劣

回归：均方误差
分类：F1

比较检验——判断实质差别

对于性能度量之后的模型，我们仍然很难判断它一定好或者一定差，所以我们采用假设检验的方法，进一步确定它是否好或者坏。