Datawhale X 李宏毅苹果书AI夏令营 | 机器学习基础

16 阅读2分钟

修订历史:

  • 2024-08-26 完成机器学习基础概念笔记

1 术语和定义

1.1 基础技术术语

1.1.1 机器学习 machine learning

让机器具备找一个函数的能力。

1.1.2 回归 regression

假设要找的函数的输出是一个数值,一个标量,这种机器学习的任务称为回归。

1.1.3 分类 classification

假设要找的函数的输出是从设定好的选项里面选择一个当作输出,该任务称为分类。

类别 class

分类任务中,这些事先准备好的选项可以被称为类别。

1.1.4 结构化学习 structured learning

这种让机器产生有结构的东西的问题称为结构化学习。比如让机器画一张图,写一篇文章。

1.1.5 领域知识 domain knowledge

领域知识指的是对所研究的问题的本质上的了解。

1.1.6 模型 model

带有未知的参数的函数。

1.1.7 特征 feature

特征是模型里面已知的,来自于后台的信息。

权重 weight

模型中的一个未知的参数。

偏置 bias

模型中的一个未知的参数。

1.1.8 损失 loss

损失是权重和偏置的函数 L(b,w)L(b, w)

1.1.9 标签 label

真实的值称为标签。

1.1.10 平均绝对误差 Mean Absolute Error; MAE

估测的值与实际的值之间的差的绝对值。

均方误差 Mean Squared Error;MSE

估测的值与标签的差的平方。

1.1.11 交叉熵 cross entropy

一种用于计算当估测值和标签都是概率分布情况下的差距的计算方法。

1.1.12 误差表面 error surface

尝试模型的未知参数的各种不同值,计算它的损失,以此绘制出来的等高线图称为误差表面。

1.1.13 梯度下降 gradient descent

一种最优化方法。

1.1.14 超参数 hyperparameter

在机器学习中,需要自己设定,不是机器自己找出来的参数称为超参数。

2 机器学习基础

2.1 机器学习训练

机器学习找函数(机器学习训练)的过程,可以分成 3 个步骤:

  1. 写出一个带有未知参数的函数 ff,比如 y=b+ωx1y = b + \omega x_1
  2. 定义损失函数;
  3. 求解一个最优化问题。

2.2 机器学习训练停止条件

常见的训练停止有两种情况:

  • 达到设定的最大次数;
  • 损失值稳定,不再出现变化。