第五天-机器学习开始(随记)

175 阅读1分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第5天,点击查看活动详情

1.Machine Learning

Numpy 科学计算库(矩阵操作)

数据由数据特征组成,可有矩阵表示

2.Pandas 数据分析数据库

便利的完成数据分析处理

3.Matplotlib 数据可视化库

4.Scikit-learn 机器学习库

封装很多机器学习算法,可以很方便地调用算法、构建模型

\

2.机器学习算法分类

1.有监督

有预测(有标签值的学习) 在监督学习训练过程中,可以由训练数据集学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。该算法要求特定的输入/输出,首先需要决定使用哪种数据作为范例。例如,文字识别应用中一个手写的字符,或一行手写文字。

2.无监督

无预测(无标签值的学习)

\

3.线性回归

回归:最终要预测出具体的值

(分类:最终得出的是一个类别结果,不是一个具体值“比如1代表x结果,2代表y结果”)

\

由特征预测值

y=θx+ε

分别是:标签值,预测值,偏差

标签值是传给机器的真实值,供机器学习。

偏差独立相同分布(独立指每个样本之间独立,同分布指定的是误差范围)

这个公式通常认为服从均值为0方差为θ方的高斯分布(均值不为零时,可以上下移动表达式图像“可以理解为调整偏差值”使其均值为0)

\

线性回归的表达式是wx+b型。由多个特征值得出的结果。