1、什么是机器学习?

666 阅读4分钟

概述和定义

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、计算机科学等多门学科。

Mitchell 在1997给出了一个具象化定义:假设用P(Performace)来评估计算机程序在某类任务T(Task)上的性能,若一个程序通过利用经验E(Experience)在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。

机器学习的过程就是计算机通过输入大量的数据进行训练建模,模型学习到数据的规律,再对新输入的数据进行分类或预测。

学习流程如下图:

应用场景

互联网发展经历了快速发展期,数据量暴增,积累了各行业大量的数据,同时也促进了机器学习的应用,大家熟知的智能推荐系统、广告系统、垃圾邮件过滤、人脸识别(深度学习)、语音助手、输入法、百度/google搜索、精准营销......

1、精准营销:通过用户画像和用户行为数据等,实现针对用户的营销活动,使成交率更高;比如有些人经常接到信用卡营销电话。

2、输入法:可以根据用户的错误输入进行修正以及预测你要输入哪些文字;

3、垃圾邮件过滤:对邮件进行过滤处理,识别垃圾邮件进行处理。

什么场景下使用机器学习?

目前机器学习成为解决问题的强大工具,但是并非所有问题都能通过机器学习来解决,机器学习需要在正确的场景下使用,并且是需要有数据支撑的。

既然机器学习能够解决问题,应该在什么场景下使用呢?

1、需要有大量的数据支撑,数据量越大,训练出来的模型准确度越高。

2、人为无法精确总结出数据之间的关联关系或者数据量庞大无法处理任务时,但是验证数据中的因素确实又会影响结果,往往可以使用机器学习技术解决这些问题。

比如:可以根据用户画像和用户行为记录可以进行商品推荐;通过学习根据图片像素识别图像属于什么动物;信用卡欺诈等等;

人工智能与机器学习

很多刚开始学习机器学习的人会感到疑惑,人工智能(AI)、机器学习(Machine Learning,ML)、深度学习(Deep Learning,DL)、计算机视觉(CV)、自然语言处理(NLP)这些之间底是什么关系?

关系如下图所示:

人工智能包括了机器学习、计算机视觉、自然语言处理、深度学习。机器学习是人工智能的一个子方向,深度学习是机器学习的一类,机器视觉和自然语言处理是人工智能领域的两个具体应用方向,一般都会涉及到深度学习,所以这些都绕不开机器学习,机器学习也是人工智能的基础。

学习路径和方法

初学机器学习,很多人不知道怎么入门,有时候学习一个月了还区分不清什么是分类,什么是回归?觉得一头雾水,重新学习下数学知识、统计知识?迟迟能入门。

出现这种现象很正常,开始就说了机器学习是一门多领域交叉学科,涉及到的概念确实比较多,一串串代码再加上看不懂的数学公式和似懂非懂高深的理论,入门确实成了一个门槛。

1、首先学习机器学习要有耐心,一口吃不成胖子。

2、掌握Python编程语言,Python在机器学习中用的多些,因为其相关的三方库非常丰富。

3、找一本适合自己的机器学习书籍或教程,先从头到尾通学一遍,了解算法、建模流程、评估函数、特征工程、数据处理等这些概念后,再回头学机器学习会发现会更轻松些,高深的数学理论和公式先不要过多的去研究,理解就好,可以在后续的学习中持续深入。

4、优质有效的学习资源:sklearn官网、Pytorch官网、github网站、kaggle网站