首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
sparkml
订阅
用户272269388281
更多收藏集
微信扫码分享
微信
新浪微博
QQ
4篇文章 · 0订阅
【Spark MLlib】(二)Spark MLlib 特征工程 - 提取、转换和选择
提取(Extraction):从“原始”数据中提取特征转换(Transformation):缩放,转换或修改特征选择(Selection):从较大的一组特征中选择一个子集局部敏感哈希(Locality Sensitive Hashing,LSH):这类算法将特征变换的各个方面与其...
Spark-线性回归示例01
房屋普查,预测房价,最后预测结果不太准确,后续会调整,可能的原因:最直接原因指标项没有强线性关系,使用的参数不准确。只是为了熟悉下流程。import org.apache.spark.ml.feature.import org.apache.spark.sql.types.imp...
图解大数据 | Spark机器学习(上)-工作流与特征工程
本文介绍Spark中用于大数据机器学习的板块MLlib/ML,讲解机器学习工作流(Pipeline)及其构建方式,并详解讲解基于DataFrame的Spark ML特征工程,包括二值化、标准化等。
利用Spark MLIB实现电影推荐
源码及数据集:https://github.Spark 机器学习库MLLib MLlib是Spark的机器学习(Machine Learning)库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模。MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降...