提取码:600x
机器学习就是想让机器去完成靠直接靠直接编程无法完成的一些东西,就是通过一些大量的数据,然后我去训练出一个模型,然后通过这个模型去预测呀,或者说去分析什么的。 这个就是非常通俗的去讲,机器学习到底是什么。 要不然一看这个名词,然后再去不懂的话,去百度上一搜,哇,讲的好专业还是不懂。 说我用最通俗的语言跟大家说一下,什么是机器学习。
机器学习就是这个东西,就是说白了我是想让机器去理解人类的这些思想,或者说一些一些想法什么的。 提到机器学习,不得不提的就是说一个是有监督学习,还有一个是无监督学习,这个如果不懂的朋友们听起来是非常专业的。
但是说你这个不能再省去了,这个是一定要知道的。 我也会跟大家简单说一下,什么是有监督学习,非常好理解。 如果从专业的角度来说,,有监督学习,你在准备数据的时候,,数据是有标记的数据。 什么叫有标记的数据?
你在做分类的时候,你传入的数据,就是说我会标记出他是在哪个类别,这相当于是有标记的数据。 就是说白了相当于是有一个老师去告诉你这个模型该怎么样去训练,该朝哪个方向去训练,这就是有监督的学习。 有监督的学习它的一些常用的算法,它也就是一个分类分类或者说是回归。 常用算法,SVM就是说支持向量机,然后还有决策树,还有K金零距离,然后还有朴素贝叶斯等等等等,都是一些分类算法。
与有监督学习正好相反的呢,就是无监督学习。 如果聪明的朋友根据我刚才说有监督学习的这个数据准备,他肯定知道无监督学习的数据准备是什么。 就是说无监督学习它的数据准备就是没有标记的数据,就完全是让模型自己去根据这个原有的数据去分析出一些有价值的东西。
就相当于是没有老师告诉你,你该怎么做。
这个最典型的就是说是聚类嘛,你给你一堆数据,然后你通过这个模型算法,你去具出不同的类别,这跟分类正好就是相反的。 说这个就是无监督学习。 大家就记住有监督学习和无监督学习。
只要从数据上来区别,你在准备数据的时候,,一个是有标记的数据,还有一个就是无标记的数据,就相当于有标记的数据。 就相当于是老师告诉你该怎么去学习。