MAE & MAPE & MSE & R^2

275 阅读2分钟

1. 📏 MAE(Mean Absolute Error)

公式:

MAE=1ni=1nyiy^i\text{MAE} = \frac{1}{n} \sum_{i=1}^n |y_i - \hat{y}_i|

含义:

  • 预测值和真实值的“绝对差”的平均值。
  • 它不关心误差是正的还是负的,只关心偏离了多少。

优点:

  • 容易理解,单位跟目标值一样。
  • 对异常值不敏感。

2. 📐 MAPE(Mean Absolute Percentage Error)

公式:

MAPE=1ni=1nyiy^iyi×100%\text{MAPE} = \frac{1}{n} \sum_{i=1}^n \left| \frac{y_i - \hat{y}_i}{y_i} \right| \times 100\%

含义:

  • 预测误差占真实值的“百分比”,然后取平均。
  • 更直观地反映“预测相对误差”。

优点:

  • 没有单位,便于跨问题对比。
  • 更适用于商业、金融等“相对准确率”重要的领域。

缺点:

  • 当真实值为 0 时会出问题。
  • 对小值比较敏感。

3. 🔧 MSE(Mean Squared Error)

公式:

MSE=1ni=1n(yiy^i)2\text{MSE} = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2

含义:

  • 平方误差的平均值。
  • 相比 MAE,它对“大误差”惩罚得更厉害(因为平方了)。

优点:

  • 数学性质好,容易求导优化(用于训练模型很常见)。
  • 对大误差非常敏感,更严苛。

缺点:

  • 不太直观,单位是目标值单位的平方。

4. 📊 R²(决定系数 / Coefficient of Determination)

公式:

R2=1(yiy^i)2(yiyˉ)2R^2 = 1 - \frac{\sum (y_i - \hat{y}_i)^2}{\sum (y_i - \bar{y})^2}

其中:

  • yiy_i:真实值
  • y^i\hat{y}_i:预测值
  • yˉ\bar{y}:真实值的均值(即所有 yiy_i 的平均)

✨ 它到底在衡量啥?

R² 衡量的是:你的模型解释了真实数据中变异的比例。 可以理解为:

R² 值含义
1完美预测,误差为 0(几乎不可能)
0预测效果和瞎猜一样(预测不如均值好不了多少)
< 0模型比直接用平均值还烂

✅ 优点:

  • 直观:越接近 1 表示模型越好。
  • 对比性强:可以比较不同模型在同一个数据集上的表现。

⚠️ 注意事项:

  • R² 只能用于 回归任务,不能用于分类。
  • 它对异常值和分布有一定敏感性。
  • 对于非线性关系,R² 可能不那么好用(尤其当数据分布奇怪的时候)。
  • 加入更多特征可能会让 R² 假性上升,所以常用 调整后的 R²(Adjusted R²) 来惩罚不必要的特征。