决策树这是我参与11月更文挑战的第13天，活动详情查看：2021最后一次更文挑战决策树的原理经验总结 - 得出结论

这是我参与11月更文挑战的第13天，活动详情查看：2021最后一次更文挑战

经验总结 - 得出结论

构造
生成一棵完整的决策树 -选择用什么属性作为节点的过程
1. 什么属性作为根节点
2. 什么属性作为子节点
3. 什么时候停止并得到目标状态 - 叶节点
剪枝 - 防止过拟合
过拟合和欠拟合
剪枝的方法 - 预剪枝和后剪枝
1. 预剪枝 - 决策树构造时 - 构造过程中对节点进行评估 - 添加不能带来准确性提升 - 不添加
2. 后剪枝 - 决策树构造后 - 叶节点开始自下而上对每个节点评估 - 删去与不删没有太大差别/ 带来明显准确性提升 - 节点删去，叶节点替代，类别用该节点子树最频繁的那个类

经验总结 - 得出结论

构造 - 剪枝【预剪枝【构造时评估不能带来准确性提升】、后剪枝【构造后评估如果去掉】

特征选取方法 - 基于信息熵 - 降低信息熵【-plogp】 - ID3、C4.5、Cart

ID3 - 信息增益 - （当前信息熵 - 生成新节点后的信息熵）= （父节点信息熵 - 所有子节点信息熵【子节点归一化信息熵）-倾向选择取值多的属性 - 噪声敏感 - 信息增益越大越好步骤：

C4.5 - 信息增益率 - （信息增益 / 属性熵） - 保证整体信息增益率不变 - 解决了噪声敏感

决策树的构造过程 - 纯度越高的划分