机器学习

226 阅读1分钟

机器学习的步骤

1.收集数据

2.数据准备

在实际工作中,收集到的数据可能会有各种问题,所以会涉及到数据清理的工作.
当数据本身没什么问题之后,将数据分为三个部分:训练集(60%)、验证集(20%)、测试集(20%),用于后面的验证和评估工作.
训练集:用来训练模型
验证集:确保模型没有过拟合
测试集:用来评估模型效果

3.选择一个模型

4.训练

5.评估

一旦训练完成,就可以评估模型是否有用。这是我们之前预留的验证集和测试集发挥作用的地方。评估的指标主要有 准确率、召回率、F值.
这个过程可以让我们看到模型如何对尚未看到的数是如何做预测的。这意味着代表模型在现实世界中的表现。

6.参数调整

完成评估后,您可能希望了解是否可以以任何方式进一步改进训练。我们可以通过调整参数来做到这一点。当我们进行训练时,我们隐含地假设了一些参数,我们可以通过认为的调整这些参数让模型表现的更出色

7.预测(开始使用)