训练集
用来训练,构建模型
验证集
在模型训练阶段,用来测试模型的好坏
测试集
等模型训练好后,用来评估模型的好坏
监督学习
有标签的数据
无监督学习
没有标签的数据
半监督学习
有监督学习、无监督学习相结合的一种学习方式,用来解决一小部分带标签的数据、一大部分无标签的数据进行训练和分类的问题
应用
回归
预测
分类
数据带有标签,属于有监督学习
-
- 图像识别
-
- 垃圾邮件的识别
-
- 文本分类
- ...
聚类
数据无标签,属于无监督学习
- 回归:预测数据为连续型数值
- 分类:预测数据为类别型数据,并且类别已知
- 聚类:预测数据为类别型数据,并且类别未知