稀土掘金 稀土掘金
    • 首页
    • AI Coding
    • 数据标注 NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
大数据
订阅
avatar
Tinker
更多收藏集

微信扫码分享

微信
新浪微博
QQ

2篇文章 · 0订阅
  • Spark的Shuffle总结分析
    Shuffle就是对数据进行重组,由于分布式计算的特性和要求,在实现细节上更加繁琐和复杂。 在MapReduce框架,Shuffle是连接Map和Reduce之间的桥梁,Map阶段通过shuffle读取数据并输出到对应的Reduce,而Reduce阶段负责从Map端拉取数据并进…
    • 说出你的愿望吧
    • 5年前
    • 4.5k
    • 51
    • 20
    Spark
  • Spark二级调度系统Stage划分算法和最佳任务调度细节剖析-Spark商业环境实战
    本套系列博客从真实商业环境抽取案例进行总结和分享,并给出Spark源码解读及商业实战指导,请持续关注本套博客。 1. Spark调度系统的组件关系 一级调度:Cluster Manger (YARN模式下为ResourceManger , Standalone 模式下为 Mas…
    • 技术洞察TIC
    • 7年前
    • 2.0k
    • 2
    • 评论
    Spark