首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
驰
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
驰
赞了这篇文章
源码那些事儿
公众号:源码那些事儿
·
6年前
关注
Spark读hive text表之非shuffle方式增大并行度
正常情况下,一个spark task要处理一个partition即128M的数据,因处理过程较耗时而成为任务瓶颈。 大的方向是进行任务拆分,增大并行度。 结论:测试发现,虽...
2
评论
分享
驰
赞了这篇文章
源码那些事儿
公众号:源码那些事儿
·
6年前
关注
Spark local模式连接集群hdfs、hive
Spark提供了local、standalone、on yarn等多种运行模式,但为了保持开发环境与实际运行环境的一致性,通常都是在本地编写代码,然后编译并上传jar包到S...
4
5
分享
驰
关注了
源码那些事儿
关注了
1
关注者
0
收藏集
0
关注标签
0
加入于
2019-05-14