首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
用户5378614871600
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
3
文章 3
沸点 0
赞
3
返回
|
搜索文章
赞
文章( 3 )
沸点( 0 )
PySpark基础入门(7):Spark SQL
SparkSQL 是Spark的一个模块, 用于处理海量结构化数据;PySpark使用DataFrame进行数据抽象,是一个二维表数据结构,适用于分布式集合
PySpark基础入门(6):Spark Shuffle
Shuffle是连接map和reduce之间的桥梁,它将map的输出对应到reduce输入中,涉及到序列化反序列化、跨节点网络IO以及磁盘读写IO等
PySpark基础入门(5):Spark 内核调度
Spark任务调度:如何组织任务去处理RDD中每个分区的数据,根据RDD的依赖关系构建DAG,基于DAG划分Stage,将每个Stage中的任务发到指定节点运行
关注了
7
关注者
0
收藏集
0
关注标签
11
加入于
2022-11-02