第五天-机器学习开始（随记）携手创作，共同成长！这是我参与「掘金日新计划 · 8 月更文挑战」的第5天，点击查看活动详情

携手创作，共同成长！这是我参与「掘金日新计划 · 8 月更文挑战」的第5天，点击查看活动详情

1.Machine Learning

Numpy 科学计算库（矩阵操作）

数据由数据特征组成，可有矩阵表示

2.Pandas 数据分析数据库

便利的完成数据分析处理

3.Matplotlib 数据可视化库

4.Scikit-learn 机器学习库

封装很多机器学习算法，可以很方便地调用算法、构建模型

2.机器学习算法分类

1.有监督

有预测（有标签值的学习）在监督学习训练过程中，可以由训练数据集学到或建立一个模式（函数 / learning model），并依此模式推测新的实例。该算法要求特定的输入/输出，首先需要决定使用哪种数据作为范例。例如，文字识别应用中一个手写的字符，或一行手写文字。

2.无监督

无预测（无标签值的学习）

3.线性回归

回归：最终要预测出具体的值

（分类：最终得出的是一个类别结果，不是一个具体值“比如1代表x结果，2代表y结果”）

由特征预测值

y=θx+ε

分别是：标签值，预测值，偏差

标签值是传给机器的真实值，供机器学习。

偏差独立相同分布（独立指每个样本之间独立，同分布指定的是误差范围）

这个公式通常认为服从均值为0方差为θ方的高斯分布（均值不为零时，可以上下移动表达式图像“可以理解为调整偏差值”使其均值为0）

线性回归的表达式是wx+b型。由多个特征值得出的结果。