首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Linzx的学习笔记
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
Linzx的学习笔记
4年前
关注
Spark基础05-map和mapValue
0、前言 真实面试题: 使用了reduceByKey()和groupByKey()等xxxByKey()算子一定会产生shuffle吗? Spark 如何优化或者减少shu...
1
评论
分享
Linzx的学习笔记
4年前
关注
Spark基础04-RDD重分区操作repartition与coalesce
1、repartition 1.1、官方解释 返回一个新的RDD具有 (numPartitions) 指定的分区数,可以通过该方法进行RDD并行度(分区数)的修改 如果要减...
0
评论
分享
Linzx的学习笔记
4年前
关注
Spark基础03-关联外部数据源操作
1、通过map关联外部数据源 问题:每一条数据都会对数据库建立连接,执行SQL语句,关闭连接。频繁的建立关闭连接会造成大量的资源消耗 2、通过mapPartitionsWi...
0
评论
分享
Linzx的学习笔记
4年前
关注
Spark基础02-RDD数据集操作
0、拓展 spark数据移动的两种方式: IO移动:指数据不需要区分每一条数据归属于哪个分区,既不需要通过partitioner shuffle:指数据需要经过洗牌,计算其...
0
评论
分享
Linzx的学习笔记
4年前
关注
Spark基础01-RDD和宽窄依赖
1、RDD 官方解释是:A Resilient Distributed Dataset (RDD), the basic abstraction in Spark. Rep...
0
评论
分享
Linzx的学习笔记
关注了标签
Spark
Linzx的学习笔记
4年前
关注
Spark源码解析01-Master启动流程
1、前言 Master是spark中核心角色,涉及到集群通信以及资源调用申请,不仅要接收Driver,Worker的注册调用,还需要根据调度情况知道其他角色的状态,例如:E...
0
评论
分享
Linzx的学习笔记
关注了标签
Hadoop
Linzx的学习笔记
关注了标签
Java
个人成就
文章被点赞
7
文章被阅读
15,413
掘力值
555
关注了
0
关注者
10
收藏集
0
关注标签
6
加入于
2018-12-04