首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
想做个好程序员
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
8
文章 8
沸点 0
赞
8
返回
|
搜索文章
最新
热门
20220919问题记录
一、Spark中coalesce和repartiton的区别 repartition对数据进行完全洗牌,创建新的数据分区,这些分区的数据量是均衡分布的。 repartition必然会造成shuffle
Spark的容错机制
一般而言,分布式数据集的容错性具备两种方式:数据检查点和记录数据的更新 checkpoint机制——数据检查点 记录更新机制(在Saprk中对应Lineage机制) checkpoint机制 chec
SparkSQL用户自定义函数UDF和UDAF、UDTF
执行UDF 输出结果 UDF和UDAF的区别 UDF(User Defined Functions) 是普通的不会产生 Shuffle 不会划分新的阶段的用户自定义函数,UDAF(User Defin
Spark常用算子
Spark 算子大致可以分为以下三类: 1、map是对RDD中的每个元素都执行一个指定的函数来产生一个新的RDD。任何原RDD中的元素在新RDD中都有且只有一个元素与之对应。 2、mapPartiti
1.Spark创建RDD创建方式有哪些
在Spark中创建RDD的创建方式可以分为三种:从集合中创建RDD、从外部存储创建RDD、从其他RDD创建。
su hdfs 出现 This account is currently not available.
记录Spark车辆,分析,配置,安装,运行 遇到的问题。包括HDFS,Spark,CM,Hive等等
个人成就
文章被阅读
1,216
掘力值
66
关注了
14
关注者
0
收藏集
2
关注标签
31
加入于
2016-06-29