携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第1天,点击查看活动详情
Scikit-learn 和 Keras是我们学习机器学习均不可回避的两种软件。均不可回避意味着两者缺一不可,通常情况下SCIkit-learn能实现几乎所有的机器学习算法模型,比如回归、分类、聚类、预测、模型评估等等算法模型。甚至它还提供一些数据预处理函数。然而SCIkit-learn依赖于Numpy、pandas和Matplotlib,因此在使用scikit-learn之前,必须学习Nump、pandas和matplotlib。
SCIkit-learnen常用方法总结:
a. model.fit(x,y)和model.fit(x)
这个方法用于训练模型,前者适用监督学习模型,后者适用非监督学习模型。
b. model.predict(New_X)和model.predict_proba(New_X)以及model.score()
这三种方法是属于监督学习模型的:
model.predict(New_X): 可以预测新样本,或测试样本,预测结果是与新样本同类型的值。
model.predict_proba(New_X): 预测概率,或测试样本,预测结果是与新样本相对应的概率值
model.score(x_test,y_test)
得分越高越好
C. 非监督学习模型的方法
model.transform(): 从数据中学习到新的基底。
model.fit_transform(): 把数据按照学习到的新基底进行转换。
尽管Skit-learn功能强大,几乎可以实现大多算法模型,然而他并不包含人工神经网络算法模型。人工神经网络有三大特点:
-
功能强大
-
算法相对复杂
-
原理却很简单
人工神经网络可以应用到众多领域,比如在图像识别,语言处理等领域的应用。在我们数据分析领域,他可直接用于回归分析。
我们经常所说的“深度学习”,其本质就是一种神经网络。
利用python搭建人工神经网络我们需要用到Keras库。Keras库不仅可以搭建普通神经网络,而且还可以搭建其它较为复杂的神经网络。比如循环神经网络、递归神经网络等。