1. 📏 MAE(Mean Absolute Error)
公式:
含义:
- 预测值和真实值的“绝对差”的平均值。
- 它不关心误差是正的还是负的,只关心偏离了多少。
优点:
- 容易理解,单位跟目标值一样。
- 对异常值不敏感。
2. 📐 MAPE(Mean Absolute Percentage Error)
公式:
含义:
- 预测误差占真实值的“百分比”,然后取平均。
- 更直观地反映“预测相对误差”。
优点:
- 没有单位,便于跨问题对比。
- 更适用于商业、金融等“相对准确率”重要的领域。
缺点:
- 当真实值为 0 时会出问题。
- 对小值比较敏感。
3. 🔧 MSE(Mean Squared Error)
公式:
含义:
- 平方误差的平均值。
- 相比 MAE,它对“大误差”惩罚得更厉害(因为平方了)。
优点:
- 数学性质好,容易求导优化(用于训练模型很常见)。
- 对大误差非常敏感,更严苛。
缺点:
- 不太直观,单位是目标值单位的平方。
4. 📊 R²(决定系数 / Coefficient of Determination)
公式:
其中:
- :真实值
- :预测值
- :真实值的均值(即所有 的平均)
✨ 它到底在衡量啥?
R² 衡量的是:你的模型解释了真实数据中变异的比例。 可以理解为:
| R² 值 | 含义 |
|---|---|
| 1 | 完美预测,误差为 0(几乎不可能) |
| 0 | 预测效果和瞎猜一样(预测不如均值好不了多少) |
| < 0 | 模型比直接用平均值还烂 |
✅ 优点:
- 直观:越接近 1 表示模型越好。
- 对比性强:可以比较不同模型在同一个数据集上的表现。
⚠️ 注意事项:
- R² 只能用于 回归任务,不能用于分类。
- 它对异常值和分布有一定敏感性。
- 对于非线性关系,R² 可能不那么好用(尤其当数据分布奇怪的时候)。
- 加入更多特征可能会让 R² 假性上升,所以常用 调整后的 R²(Adjusted R²) 来惩罚不必要的特征。