机器学习的分类

169 阅读2分钟

监督学习:给机器的训练数据拥有“标记”或者“答案”。

          图像已经拥有了标定信息

          银行已经积累了一定的客户信息和他们信用卡的信用

情况

          医院已经积累了一定的病人信息和他们最终确诊是否患病的情况

          市场积累了房屋的基本信息和最终成交金额

          ······

非监督学习 给机器的训练数据没有“标记”或者“答案”。

          对没有“标记”的数据进行分类-聚类分析

          对数据进行降维处理

          特征提取:信用卡的恶心用评级和人的胖瘦无关?

          特征压缩:PCA

          降维处理的意义:方便可视化

          异常检测

半监督学习 一部分数据有“标记”或者“答案”,另一部分数据没有

          更常见:各种原因产生的标记缺失

          通常都先使用无监督学习手段对数据做处理,之后使用监督学习手段做模型的训练和与预测

增强学习:根据周围环境的情况,采取行动,根据采取行动的结果,学习行动方式。

无人驾驶、机器人

监督学习和半监督学习是基础

机器学习的其他分类:

批量学习

优点:简单

问题:如何适应环境变化?

解决方案:定时重新批量学习

缺点:每次重新批量学习,运算量巨大

          在某些环境变化非常快的情况下,甚至不可能的。

在线学习

优点:及时反映新的环境变化

问题:新的数据带来不好的变化?

解决方案:需要加强对数据进行监控

其他:也适用于数据量巨大,完全无法批量学习的环境。

机器学习的另一种分类:

参数学习

特点:一旦学到了参数,就不再需要原有的数据集。

非参数学习

不对模型进行过多假设

非参数不等于没参数!