前言
随着互联网数据不断累积,硬件不断升级迭代,在这个信息爆炸的时代,机器学习已被应用在各行各业中,可谓无处不在。
一些常见的机器学习的应用,例如:
- 手写识别
- 垃圾邮件分类
- 搜索引擎
- 图像处理
- …
使用到机器学习的一些案例:
- 数据挖掘
- 网页点击流数据分析
- 人工无法处理的工作(量大)
- 手写识别
- 计算机视觉
- 个人定制
- 推荐系统
- 研究大脑
- ……
现在机器学习在各种领域中被应用的非常广泛!
什么是机器学习(What is Machine Learning)
吴恩达在课程中提到:
1. 机器学习定义
这里主要有两种定义:
-
Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.
这个定义有点不正式但提出的时间最早,来自于一个懂得计算机编程的下棋菜鸟。他编写了一个程序,但没有显式地编程每一步该怎么走,而是让计算机自己和自己对弈,并不断地计算布局的好坏,来判断什么情况下获胜的概率高,从而积累经验,好似学习,最后,这个计算机程序成为了一个比他自己还厉害的棋手。
-
Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
Tom Mitchell 的定义更为现代和正式。在过滤垃圾邮件这个例子中,电子邮件系统会根据用户对电子邮件的标记(是/不是垃圾邮件)不断学习,从而提升过滤垃圾邮件的准确率,定义中的三个字母分别代表:
- T(Task): 过滤垃圾邮件任务。
- P(Performance): 电子邮件系统过滤垃圾邮件的准确率。
- E(Experience): 用户对电子邮件的标记。
2. 机器学习算法
主要有两种机器学习的算法分类
- 监督学习
- 无监督学习
两者的区别为是否需要人工参与数据结果的标注。这两部分的内容占比很大,并且很重要,掌握好了可以在以后的应用中节省大把大把的时间~
还有一些算法也属于机器学习领域,诸如:
- 半监督学习: 介于监督学习于无监督学习之间
- 推荐算法: 没错,就是那些个买完某商品后还推荐同款的某购物网站所用的算法。
- 强化学习: 通过观察来学习如何做出动作,每个动作都会对环境有所影响,而环境的反馈又可以引导该学习算法。
- 迁移学习