机器学习的步骤
1.收集数据
2.数据准备
在实际工作中,收集到的数据可能会有各种问题,所以会涉及到数据清理的工作.
当数据本身没什么问题之后,将数据分为三个部分:训练集(60%)、验证集(20%)、测试集(20%),用于后面的验证和评估工作.
训练集:用来训练模型
验证集:确保模型没有过拟合
测试集:用来评估模型效果
3.选择一个模型
4.训练
5.评估
一旦训练完成,就可以评估模型是否有用。这是我们之前预留的验证集和测试集发挥作用的地方。评估的指标主要有 准确率、召回率、F值.
这个过程可以让我们看到模型如何对尚未看到的数是如何做预测的。这意味着代表模型在现实世界中的表现。
6.参数调整
完成评估后,您可能希望了解是否可以以任何方式进一步改进训练。我们可以通过调整参数来做到这一点。当我们进行训练时,我们隐含地假设了一些参数,我们可以通过认为的调整这些参数让模型表现的更出色