首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
spark
订阅
用户7636934852497
更多收藏集
微信扫码分享
微信
新浪微博
QQ
4篇文章 · 0订阅
Spark Shuffle
shuffle不是spark的专属产物,MR里也有。这是大数据分布式计算的逻辑,分布式计算就得这么搞。只不过spark在源码里做了很多能让分布式计算变快的操作! 这是我们作为程序员使用spark的代码。在程序跑起来的时候,首先创建了SparkContext,这里面细节就多了去了…
Spark Streaming
一、SparkStreaming概述1.SparkStreaming设计动机很多重要的应用要处理大量在线流式数据,并返回近实时的结果社交网络趋势跟踪电商网站指标统计广告系统具备分布式流式处理框架的基本
细解spark的shuffle
DAGScheduler 以 Shuffle 为边界,将计算图DAG切分为多个Stages.显然shuffle起着关键的作用。 什么是shuffle Shuffle 的本意是扑克的“洗牌”,在分布式计
Spark的Shuffle总结分析
Shuffle就是对数据进行重组,由于分布式计算的特性和要求,在实现细节上更加繁琐和复杂。 在MapReduce框架,Shuffle是连接Map和Reduce之间的桥梁,Map阶段通过shuffle读取数据并输出到对应的Reduce,而Reduce阶段负责从Map端拉取数据并进…