一文带你了解机器学习

591 阅读4分钟

什么是机器学习?

机器学习(Machine Learning)是人工智能的一个分支,主要是设计和分析一些让计算机可以自动学习的算法。机器学习是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。
简而言之就是,通过大量已经存在的数据,寻找其中存在的可能规律,来预测未来的结果。比如,我们可以通过分析过去几天已经存在的大量天气数据,在这些数据里寻找潜在的规律来预测明天或者后天的天气如何。这就是机器学习的应用之一。

机器学习系统类型

根据机器学习系统学习预测或生成内容的方式,它们可以分成以下几类:

  • 监督式学习
  • 非监督式学习
  • 强化学习
  • 生成式AI

监督式学习

监督式学习模型在查看包含正确答案的大量数据后,可以发现产生正确答案的数据元素之间的关联,然后进行预测。比如每当期末周来临,就有人通过学习分析过去的真题,来准备和预测未来的考试题目。过去的真题是已经有的真实数据,而未来的考试题目是未知的。这个过程是监督式的,人们在已有正确数据的基础上来预测未知的数据。
监督式学习最常见的就是回归和分类。
回归
回归模型可以预测数字。比如:用来预测未来的房价的这个模型可以是回归模型。我们提供房子的相关信息,面积大小,房子结构等有关信息,最终得到未来出售时的价格。
分类
分类模型用来预测某个对象属于某个类别的可能性,与输出为数字的回归模型不一样的是,分类模型是输出一个值,用来表明某个对象是否属于特定类别。分类模型一般分为两类:二元分类和多元分类。二元分类模型会输出仅包含两个值的类中的值,比如yes 或 no。而多类分类模型会从包含多个值的类中输出一个值,比如rain,wind,temperature等。

非监督式学习

非监督式学习模型通过获得不包含正确答案的数据来进行预测。非监督式学习模型的目标是找出数据中具有意义的模式。换句话说,模型没有关于如何对每项数据进行分类的提示,而是必须靠推断自己的规则。 一种常用的非监督式模型采用了一种称为聚类的技术。该模型会查找可划分自然分组的数据点。

image.png 聚类与分类不同,因为类别不是由我们自身来定义的。比如,无监督模型可能会根据温度对天气数据集进行分组,从而定义季节的分类。然后根据对数据集的理解给这些集群命名。

image.png

强化学习

强化学习模型会根据在环境中执行的奖励或惩罚,从而进行预测。当模型做出满意的结果时,给它一定的奖励。如果生成结果较差时,给它一定的惩罚。在这种奖励和惩罚的过程中,模型会朝着高奖励的方向输出内容,生成的结果会越来越符合我们的预期。

生成式AI

生成式AI是一类根据用户输入生成内容的模型。如,生成式AI可以根据内容生成对应的文章,图片,音频等。
我们可以通过生成模型的输入和输出来讨论它们,通常以"输入类型"到"输出类型"的形式写出。目前生成式AI已经很强大,文本到文本,文本到图片,文本到音频等都能实现。

结语

以上内容就是机器学习的初步内容,希望能够让你对机器学习有个初步的认识。