携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第5天,点击查看活动详情
1.Machine Learning
Numpy 科学计算库(矩阵操作)
数据由数据特征组成,可有矩阵表示
2.Pandas 数据分析数据库
便利的完成数据分析处理
3.Matplotlib 数据可视化库
4.Scikit-learn 机器学习库
封装很多机器学习算法,可以很方便地调用算法、构建模型
\
2.机器学习算法分类
1.有监督
有预测(有标签值的学习) 在监督学习训练过程中,可以由训练数据集学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。该算法要求特定的输入/输出,首先需要决定使用哪种数据作为范例。例如,文字识别应用中一个手写的字符,或一行手写文字。
2.无监督
无预测(无标签值的学习)
\
3.线性回归
回归:最终要预测出具体的值
(分类:最终得出的是一个类别结果,不是一个具体值“比如1代表x结果,2代表y结果”)
\
由特征预测值
y=θx+ε
分别是:标签值,预测值,偏差
标签值是传给机器的真实值,供机器学习。
偏差独立相同分布(独立指每个样本之间独立,同分布指定的是误差范围)
这个公式通常认为服从均值为0方差为θ方的高斯分布(均值不为零时,可以上下移动表达式图像“可以理解为调整偏差值”使其均值为0)
\
线性回归的表达式是wx+b型。由多个特征值得出的结果。