稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
用户5378614871600的个人资料头像

用户5378614871600

掘友等级
掘友3级:新星掘友
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
3
文章 3 沸点 0
赞
3
返回
|
搜索文章
用户5378614871600的头像
用户5378614871600
关注了
托马斯_酷涛
用户5378614871600的头像
用户5378614871600
关注了
雪球工程师团队
用户5378614871600
赞了这篇文章
WHY6666的头像
WHY6666
2年前

PySpark基础入门(7):Spark SQL

SparkSQL 是Spark的一个模块, 用于处理海量结构化数据;PySpark使用DataFrame进行数据抽象,是一个二维表数据结构,适用于分布式集合...
2
评论
分享
用户5378614871600
赞了这篇文章
WHY6666的头像
WHY6666
2年前

PySpark基础入门(6):Spark Shuffle

Shuffle是连接map和reduce之间的桥梁,它将map的输出对应到reduce输入中,涉及到序列化反序列化、跨节点网络IO以及磁盘读写IO等...
3
评论
分享
用户5378614871600
赞了这篇文章
WHY6666的头像
WHY6666
2年前

PySpark基础入门(5):Spark 内核调度

Spark任务调度:如何组织任务去处理RDD中每个分区的数据,根据RDD的依赖关系构建DAG,基于DAG划分Stage,将每个Stage中的任务发到指定节点运行...
2
评论
分享
用户5378614871600的头像
用户5378614871600
关注了
WHY6666
用户5378614871600的头像
用户5378614871600
关注了
Python与大数据
用户5378614871600的头像
用户5378614871600
关注了
Mark_Zoe
用户5378614871600的头像
用户5378614871600
关注了
竹子爱熊猫
用户5378614871600的头像
用户5378614871600
关注了
大数据老司机
关注了
7
关注者
0
收藏集
0
关注标签
11
加入于
2022-11-02