首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
spark
订阅
coldwind6
更多收藏集
微信扫码分享
微信
新浪微博
QQ
5篇文章 · 0订阅
搭建Spark on Yarn集群
Spark是加州大学伯克利分校AMP实验室开发的通用内存并行计算框架,相对于MapReduce批处理计算,Spark可以带来上百倍的性能提升,成为最为广泛使用的分布式计算框架。
Spark资源调度参数调优深入剖析-Spark商业调优实战
本套系列博客从真实商业环境抽取案例进行总结和分享,并给出Spark商业应用实战指导,请持续关注本套博客。 参数说明:该参数用于设置Spark作业总共要用多少个Executor进程来执行。Driver在向YARN集群管理器申请资源时,YARN集群管理器会尽可能按照你的设置来在集群…
Cris 带你快速入门 Flink
在开源世界里,Apache Storm项目是流处理的先锋。Storm最早由Nathan Marz和创业公司BackType的一个团队开发,后来才被Apache基金会接纳。Storm提供了低延迟的流处理,但是它为实时性付出了一些代价:很难实现高吞吐,并且其正确性没能达到通常所需的…
Spark面对OOM问题的解决方法及优化总结
http://blog.csdn. map执行中内存溢出代表了所有map类型的操作,包括:flatMap,filter,mapPatitions等。shuffle后内存溢出的shuffle操作包括join,reduceByKey,repartition等操作。后面先总结一下...
spark的内存和OOM问题。
在理解OOM问题得先理解spark 的内存。 Spark 内存区域划分 spark的Executor的Container内存有两大部分组成:堆外内存和Executor内存。 堆外内存 spark.ex