监督学习与非监督学习

112 阅读2分钟

机器学习

机器学习中最常用的是监督学习和非监督学习。其中监督学习又可划分为回归和分类

监督学习——回归

学习x到y或输入到输出映射的算法,首先给定输入x的正确标签y,并通过查看正确的输入x和所需输出标签y,最终是要学会只接受输入而不需要输出并且可以给出合理准确的预测。对于回归而言,预测产生的值可能会很多,但是对于分类,产生的值会很少
回归预测示例:首先会给出房子大小和房子价格二者之间的数据,然后根据这些数据用于预测之后给定的数据,就是只给出房子的大小,然后预测这是房子的价格,这时候就需要一条拟合的线(可能是曲线也可能是直线,根据拟合曲线的不同,就会得到不同的房价预测值)

监督学习——分类

对于分类而言,分类预测的是可能输出类别的有限集合,例如0、1、2而不是介于两者之间的所有的可能数字 例如:对于良性肿瘤和恶性肿瘤的划分,是要找到一个界限用于区分良性肿瘤和恶性肿瘤

无监督学习——聚类

对于无监督学习而言,不会给定数据,即不会给定一个x然后对应一个y,只有给定的输入,没有对应的输出。而是根据数据的特征将数据划分为不同的集群或组。例如:每一个新闻的下面都会推送相关的新闻。

无监督学习——异常检测

异常监测并不常用,主要是在金融和诈骗方面

无监督学习——降维

总结

总而言之,机器学习最主要的监督学习和非监督学习。其中监督学习又可分为回归和分类,非监督学习中最常用的是聚类