MAE & MAPE & MSE & R^2

2025-04-24 453 阅读2分钟

1. 📏 MAE（Mean Absolute Error）

公式：

\text{MAE} = \frac{1}{n} \sum_{i=1}^n |y_i - \hat{y}_i|

含义：

预测值和真实值的“绝对差”的平均值。
它不关心误差是正的还是负的，只关心偏离了多少。

优点：

容易理解，单位跟目标值一样。
对异常值不敏感。

2. 📐 MAPE（Mean Absolute Percentage Error）

公式：

\text{MAPE} = \frac{1}{n} \sum_{i=1}^n \left| \frac{y_i - \hat{y}_i}{y_i} \right| \times 100\%

含义：

预测误差占真实值的“百分比”，然后取平均。
更直观地反映“预测相对误差”。

优点：

没有单位，便于跨问题对比。
更适用于商业、金融等“相对准确率”重要的领域。

缺点：

当真实值为 0 时会出问题。
对小值比较敏感。

3. 🔧 MSE（Mean Squared Error）

公式：

\text{MSE} = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2

含义：

平方误差的平均值。
相比 MAE，它对“大误差”惩罚得更厉害（因为平方了）。

优点：

数学性质好，容易求导优化（用于训练模型很常见）。
对大误差非常敏感，更严苛。

缺点：

不太直观，单位是目标值单位的平方。

4. 📊 R²（决定系数 / Coefficient of Determination）

公式：

R^2 = 1 - \frac{\sum (y_i - \hat{y}_i)^2}{\sum (y_i - \bar{y})^2}

其中：

$y_i$ ：真实值
$\hat{y}_i$ ：预测值
$\bar{y}$ ：真实值的均值（即所有 $y_i$ 的平均）

✨ 它到底在衡量啥？

R² 衡量的是：你的模型解释了真实数据中变异的比例。可以理解为：

R² 值	含义
1	完美预测，误差为 0（几乎不可能）
0	预测效果和瞎猜一样（预测不如均值好不了多少）
< 0	模型比直接用平均值还烂

✅ 优点：

直观：越接近 1 表示模型越好。
对比性强：可以比较不同模型在同一个数据集上的表现。

⚠️ 注意事项：

R² 只能用于 回归任务，不能用于分类。
它对异常值和分布有一定敏感性。
对于非线性关系，R² 可能不那么好用（尤其当数据分布奇怪的时候）。
加入更多特征可能会让 R² 假性上升，所以常用 调整后的 R²（Adjusted R²） 来惩罚不必要的特征。