首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
武子康
掘友等级
后端工程师
永远好奇 无限进步
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
418
文章 280
沸点 138
赞
418
返回
|
搜索文章
最新
热门
大数据-278 Spark MLib-GBDT梯度提升决策树详解:从原理到实战案例
GBDT是Boosting家族的核心算法,通过多棵决策树逐步拟合残差来减少预测误差。2024年主流版本如XGBoost、LightGBM均基于此思想扩展。本文以身高预测为案例,详解初始化学习器(均值)
大数据-277 Spark MLib-梯度提升树(GBDT)算法原理与工程实现指南
梯度提升树(GBDT,Gradient Boosting Decision Tree)是机器学习领域最成功的集成学习算法之一。本文系统讲解提升树到梯度提升树的演进路径,深入剖析GBDT的算法原理:如何
大数据-276 Spark MLib-深入理解Bagging与Boosting:集成学习核心算法对比与GBDT实战
本文深入对比Bagging与Boosting两大集成学习范式的核心差异,从数据采样、投票机制、学习顺序三大维度系统解析。Bagging通过数据采样和平权投票解决过拟合问题,Boosting通过调整样本
大数据-275 Spark MLib-集成学习:从Bagging到Boosting的群体智慧
集成学习是机器学习中提升模型泛化能力的核心技术,2024年仍广泛应用于Kaggle竞赛与工业生产。通过构建多个弱分类器并进行投票或加权组合,相比单模型可显著提升稳定性与鲁棒性。本文详解Bagging
大数据-274 Spark MLib-决策树剪枝完全指南:预剪枝与后剪枝原理对比
决策树剪枝是防止模型过拟合的关键技术,本文详解预剪枝和后剪枝两种方法的原理、优缺点及适用场景。预剪枝通过限制树的最大深度、节点样本数等指标提前停止树的生长,计算高效但可能引入欠拟合;后剪枝在树构建完成
大数据-273 Spark MLib-决策树分类算法详解:ID3、C4.5、CART 与剪枝原理
决策树作为机器学习最经典的监督学习算法之一,广泛应用于分类与回归任务。本文详解 ID3、C4.5、CART 三种主流决策树算法的分裂准则(信息增益、信息增益率、基尼系数),以及条件熵、信息增益的计算原
大数据-272 Spark MLib-Spark MLlib 逻辑回归实战:二分类场景下的原理与代码实现
本文深入讲解 Spark MLlib 中逻辑回归(Logistic Regression)的原理与实战应用。逻辑回归是机器学习中经典的二分类算法,以其简单高效的特点广泛应用于广告点击率预测、垃圾邮件识
大数据-271 Spark MLib-基础线性回归详解:从原理到损失优化实战
线性回归是机器学习中最基础的有监督学习算法,用于预测连续值输出。本文详解线性回归的定义、公式与几何意义,涵盖单变量与多变量线性关系、非线性关系分析。重点阐述损失函数(最小二乘法)的原理,以及两种优化算
大数据-270 Spark MLib-机器学习库快速入门(分类/回归/聚类/推荐)
Spark MLlib 是 Apache Spark 的机器学习库,2026年最新版本支持分布式机器学习算法训练。本文介绍 Spark MLlib 环境配置、pyspark 编程基础,以及分类算法(决
大数据-269 实时数仓-Flink+HBase+DIM层数据处理实战:构建地区维度数据仓库
基于 Flink 流处理与 HBase 构建 DIM 层维度数据仓库的完整方案。通过 HBaseReader 从原始 MySQL 地区表读取数据,利用 StreamTableEnvironment 执
下一页
个人成就
优秀创作者
文章被点赞
368
文章被阅读
43,296
掘力值
7,334
关注了
2
关注者
104
收藏集
0
关注标签
10
加入于
2019-11-11