首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
用户74303596879
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
7
文章 7
沸点 0
赞
7
返回
|
搜索文章
用户74303596879
赞了这篇文章
诗昭
java工程师、大数据工程师
·
6年前
关注
Spark入门(一)--用Spark-Shell初尝Spark滋味
spark-shell运行过程从上层来看,每一个spark应用都是由驱动器程序发起集群上的并行操作,在spark-shell中驱动器程序就是spark-shell本身。驱动...
5
2
分享
用户74303596879
赞了这篇文章
诗昭
java工程师、大数据工程师
·
6年前
关注
Spark入门(二)--如何用Idea运行我们的Spark项目
用IDEA搭建我们的环境有很多好处,其中最大的好处,就是我们甚至可以在工程当中直接运行、调试我们的代码,在控制台输出我们的结果。或者可以逐行跟踪代码,了解spark运行的机...
6
1
分享
用户74303596879
赞了这篇文章
诗昭
java工程师、大数据工程师
·
6年前
关注
Spark入门(七)--Spark的intersection、subtract、union和distinct
intersection顾名思义,他是指交叉的。当两个RDD进行intersection后,将保留两者共有的。因此对于RDD1.intersection(RDD2) 和RD...
4
1
分享
用户74303596879
赞了这篇文章
诗昭
java工程师、大数据工程师
·
6年前
关注
Spark入门(六)--Spark的combineByKey、sortBykey
combineByKey的强大之处,在于提供了三个函数操作来操作一个函数。第一个函数,是对元数据处理,从而获得一个键值对。第二个函数,是对键值键值对进行一对一的操作,即一个...
5
评论
分享
用户74303596879
赞了这篇文章
诗昭
java工程师、大数据工程师
·
6年前
关注
Spark入门(五)--Spark的reduce和reduceByKey
reduce和reduceByKey是spark中使用地非常频繁的,在字数统计中,可以看到reduceByKey的经典使用。那么reduce和reduceBykey的区别在...
6
1
分享
用户74303596879
赞了这篇文章
诗昭
java工程师、大数据工程师
·
6年前
关注
Spark入门(四)--Spark的map、flatMap、mapToPair
在上一节Spark经典的单词统计中,了解了几个RDD操作,包括flatMap,map,reduceByKey,以及后面简化的方案,countByValue。那么这一节将介绍...
14
评论
分享
用户74303596879
赞了这篇文章
诗昭
java工程师、大数据工程师
·
6年前
关注
Spark入门(三)--Spark经典的单词统计
既然要统计单词我们就需要一个包含一定数量的文本,我们这里选择了英文原著《GoneWithTheWind》(《飘》)的文本来做一个数据统计,看看文章中各个单词出现频次如何。为...
6
评论
分享
用户74303596879
关注了
诗昭
关注了
1
关注者
0
收藏集
0
关注标签
0
加入于
2024-05-10