机器学习笔记——Boosting中常用算法（GBDT、XGBoost、LightGBM）迭代路径本文主要x阐述Boost

大家好，这里是好评笔记，本文为试读，查看全文请移步公主号：Goodnote。本文主要阐述Boosting中常用算法（GBDT、XGBoost、LightGBM）的迭代路径。

@[toc]

XGBoost 相对 GBDT 的改进

GBDT（Gradient Boosting Decision Tree，梯度提升决策树） 是一种集成学习算法。GBDT 使用梯度提升（Gradient Boosting）的思想，每一棵决策树都是基于前一轮预测的残差（即误差）来训练的，从而逐步逼近真实值。

XGBoost 相对传统 GBDT 在原理和实现上进行了多项改进，使得它在计算效率、模型精度、内存管理和并行性等方面有显著提升。以下是 XGBoost 相对 GBDT 的关键改进：

在 GBDT 中，每棵树的叶子节点权重没有额外的正则化控制，容易导致模型过拟合。XGBoost 在每棵树的目标函数中引入了 ( $L_1$ ) 和 ( $L_2$ ) 正则化项，控制叶节点数量和权重大小，使模型更具泛化能力。目标函数为：

\text{Obj} = \sum_{i=1}^N L(y_i, \hat{y}_i) + \sum_{m=1}^M \Omega(f_m)

损失函数 $L(y_i, \hat{y}_i)$ 测量每个样本的预测误差。例如，常用的损失函数有：

均方误差 (MSE)：用于回归问题，定义为 $L(y_i, \hat{y}_i) = \frac{1}{2}(y_i - \hat{y}_i)^2$ 。
对数损失 (Log Loss)：用于二分类问题。 $L(y, \hat{y}) = - \left( y \cdot \log(\hat{y}) + (1 - y) \cdot \log(1 - \hat{y}) \right)$

正则化项 $\Omega(f_m)$ 用于控制模型复杂度，包含 L1 和 L2 正则化：

\Omega(f_m) = \gamma T + \frac{1}{2} \lambda \sum_{j=1}^T w_j^2 + \alpha \sum_{j=1}^T |w_j|

其中：

详细全文请移步公主号：Goodnote。