分类与回归详解:机器学习的两种典型任务
明确任务 —— 确认任务与模型选择
-
先分析任务,比如有一个情况分类的任务,针对用户评论做情感分类;
-
根据业务类型,选择模型(比如分类,早些时间可选Google Ber或T5,现在可选LLM)
准备数据
-
Dataset: 收集数据,比如情感分析中,从多终端收集用户的评论数据
-
Labeled Dataset: 数据标注,生成标注好的数据 (有监控学习的流程)
-
Train Set: 对数据进行划分:80%训练数据,20%测试集
模型训练
-
Model : 模型训练
-
Train Model: 训练后的模型,将20%的测试数据放入,评估性能与结果
-
predict result: 将20%的测试数据放入Train Model,输出预测结果
-
Evaluate Model Performance:根据不同的任务,计算准确率。
详细的任务流程见笔者的另外一文 机器学习的任务流程之流程详解