机器学习是在数据分析基础上对数据进一步提取的过程,本质上还是一种归纳总结,再进行预测的过程。 机器学习分类:
(1)监督学习 监督学习是指将已标记分类好的数据交给模型学习。 根据返回结果分为分类问题和回归问题,如果结果是有限个离散值时,那么就是分类问题,分类问题包括学习和分类两个过程,在学习过程中根据训练集利用有效的学习方法建立一个分类器,再根据分类器对新输入数据进行分类预测。 如果输出是连续值,那么就是回归问题,回归问题根据输入变量的类别数又分为一元回归和多元回归。 (2)无监督学习 无监督学习是数据中无明显标签,属于探索型学习,这类学习又分为聚类学习和数据降维。 聚类学习是在没有任何先验信息的情况下,将未标记分类的数据进行分类,归纳总结各类数据之间的共性。 而数据降维则是将高维数据压缩到维度较小的子空间进行处理,减少数据噪声,但也会降低某些算法的准确率
(3)半监督学习 在现实生活中经常会遇到收到大量未标记数据的情况,获取足够的标记数据或消耗大量的人力物力,在这种情况下可以根据已标记数据先行建立简易模型,利用聚类方法或参考相关领域“专家”意见对模型进行修正。
(4)强化学习 强化学习不像无监督学习那样完全无目标。也不像监督学习那样有明确的目标,而是进行连续决策,强化学习的短期目标是变化的,不明确的,甚至可能不存在绝对正确的路径。 诸如近些年兴起的围棋AI,Alpha Go,围棋的19*19棋盘带来了超越宇宙原子数的状态数,这就导致了现阶段计算机远远不可能像象棋ai那样通过暴力搜索战胜人类棋手。 强化学习是通过在连续决策中给予一系列根据之前的决策给出的正反馈和负反馈对AI后续决策进行修正,使正反馈趋向于最大化。