首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
spark
订阅
不想说话
更多收藏集
微信扫码分享
微信
新浪微博
QQ
2篇文章 · 0订阅
Apache Spark 分区器的实现分析
最近在学习 Apache Spark 1.4.1 的源码和写 Apache Spark 源码阅读 系列学习笔记,大多数的子模块啃得还算比较顺利,唯独分区器(Partitioner),尤其是范围分区器(Range Partitioner)这一块,代码有着诸多疑惑之处,能 Goog…
Spark 解决数据倾斜的几种常用方法
数据倾斜是大数据计算中一个最棘手的问题,出现数据倾斜后,Spark 作业的性能会比期望值差很多。数据倾斜的调优,就是利用各种技术方案解决不同类型的数据倾斜问题,保证 Spark 作业的性能。 一个 Spark 作业,会根据其内部的 Action 操作划分成多个 job,每个 j…