学习机器学习的时候,发现在机器学习中和统计学的很多概念比较相像,以前没有搞清楚统计学与机器学习到底是什么关系,最近看了一下《ALL of statistics》这本书,发现其中讲清楚了统计学与机器学习的关系:
- 统计学,数据挖掘和机器学习都涉及到收集和分析数据
- 数据分析,机器学习和数据挖掘是不同context下,统计推断的不同名字。
- 统计推断的近亲(close cousins)是数据挖掘和机器学习。
- 统计学和计算机科学(下图中主要是机器学习)经常使用不同的语言来描述相同的事情,下面这个图列举了一些统计学和机器学习中术语对比:
可以发现,比如
- 机器学习中的学习(learning)对应于统计学中的估计(estimation)
- 机器学习中的监督学习(supervised learning)对应于统计学中的分类(classification)
- 机器学习中的无监督学习(unsupervised learning)对应于统计学中的聚类(clustering)
- 等等。