吃瓜教程-第1,2章

146 阅读1分钟

第一章 绪论

1.1 引言

了解机器学习:机器学习就是一种通过计算的手段,利用经验(数据)建立模型(学习器),对新情况(新的数据)做出判断的学问。

1.2 基本术语

学习任务可分为:无监督学习与 监督学习

  • 监督学习:
    • 分类:对离散数据进行预测
    • 回归:对连续数据进行的预测
  • 无监督学习:没有标记信息,自主学习得到标签
    • 例如:聚类,将训练数据分组

1.3 假设空间

  • 归纳和演绎:归纳即从特例总结出适用于一般情况的规律,演绎即根据该规律对新的特殊情况进行预测和推理。机器学习利用特殊案例建立模型,故称为“归纳学习”。

  • 假设空间:即所有假设的集合,是一个包括∅的全集。在西瓜问题下可以理解为所有的西瓜。

  • 版本空间:与训练集一致的假设的集合。

1.4 归纳偏好

如果得到了多个与训练集一致的假设,必须根据一定的原则选择一个确定的假设,使得对于一个确定的样本,始终得出确定的结论。

例如图1.3中,有两条曲线与样本点一致,则算法必须从A、B中选择一个作为偏好。