首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
独揽月下萤火_照亮一纸寂寞
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
独揽月下萤火_照亮一纸寂寞
3年前
关注
groupBykey、reduceByKey、aggregateByKey、foldByKey和combineByKey的区别
想看这几个算子的区别,最直接了当的方法就是查看底层源码。 groupByKey: reduceByKey: aggregateByKey: foldByKey: combi...
0
评论
分享
独揽月下萤火_照亮一纸寂寞
3年前
关注
04-Spark核心编程-RDD-02
四、基础编程 双Value算子 intersection 求两个RDD的交集 函数签名: 示例: 注意:若两个RDD的数据类型不一致,则无法做交集运算。 union 求两个...
0
评论
分享
独揽月下萤火_照亮一纸寂寞
3年前
关注
04-Spark核心编程-RDD-01
一、什么是RDD? RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据处理模型。代码中是一个抽象类,它代表...
0
评论
分享
独揽月下萤火_照亮一纸寂寞
3年前
关注
03-Spark运行环境
一、Local 模式 所谓的Local模式,就是不需要其他任何节点资源就可以在本地执行Spark代码的环境,一般用于教学,调试,演示等。 由于 local 模式几乎没有人使...
0
评论
分享
独揽月下萤火_照亮一纸寂寞
3年前
关注
02-Spark快速上手
一、创建Maven项目 增加 Scala 插件 打开 IDEA ,在插件中找到 Scala ,并下载。 任意创建一个 maven 程序,在pom.xml文件中添加如下依赖(...
0
评论
分享
独揽月下萤火_照亮一纸寂寞
3年前
关注
01-Spark简介
Spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。 Spark有三大组件:core、sql 以及 streaming。 Spark Core中提供了Spar...
0
评论
分享
个人成就
文章被阅读
1,667
掘力值
62
关注了
0
关注者
0
收藏集
0
关注标签
13
加入于
2022-03-21