稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • 数据标注 HOT
    • AI Coding
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
spark
订阅
avatar
用户7636934852497
更多收藏集

微信扫码分享

微信
新浪微博
QQ

4篇文章 · 0订阅
  • Spark Shuffle
    shuffle不是spark的专属产物,MR里也有。这是大数据分布式计算的逻辑,分布式计算就得这么搞。只不过spark在源码里做了很多能让分布式计算变快的操作! 这是我们作为程序员使用spark的代码。在程序跑起来的时候,首先创建了SparkContext,这里面细节就多了去了…
    • 霍云
    • 6年前
    • 532
    • 1
    • 评论
    Spark
  • Spark Streaming
    一、SparkStreaming概述1.SparkStreaming设计动机很多重要的应用要处理大量在线流式数据,并返回近实时的结果社交网络趋势跟踪电商网站指标统计广告系统具备分布式流式处理框架的基本
    • 清风云悦
    • 6年前
    • 498
    • 1
    • 评论
    Spark
  • 细解spark的shuffle
    DAGScheduler 以 Shuffle 为边界,将计算图DAG切分为多个Stages.显然shuffle起着关键的作用。 什么是shuffle Shuffle 的本意是扑克的“洗牌”,在分布式计
    • 程sq
    • 3年前
    • 1.9k
    • 点赞
    • 评论
    后端 Spark
  • Spark的Shuffle总结分析
    Shuffle就是对数据进行重组,由于分布式计算的特性和要求,在实现细节上更加繁琐和复杂。 在MapReduce框架,Shuffle是连接Map和Reduce之间的桥梁,Map阶段通过shuffle读取数据并输出到对应的Reduce,而Reduce阶段负责从Map端拉取数据并进…
    • 说出你的愿望吧
    • 6年前
    • 4.5k
    • 51
    • 20
    Spark