首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
spark调优
订阅
1
更多收藏集
微信扫码分享
微信
新浪微博
QQ
2篇文章 · 0订阅
Spark 踩坑记:数据库(Hbase+Mysql)
最近一个实时消费者处理任务,在使用 spark streaming 进行实时的数据流处理时,我需要将计算好的数据更新到 hbase 和 mysql 中,所以本文对 spark 操作 hbase 和 mysql 的内容进行总结,并且对自己踩到的一些坑进行记录。
Spark 解决数据倾斜的几种常用方法
数据倾斜是大数据计算中一个最棘手的问题,出现数据倾斜后,Spark 作业的性能会比期望值差很多。数据倾斜的调优,就是利用各种技术方案解决不同类型的数据倾斜问题,保证 Spark 作业的性能。 一个 Spark 作业,会根据其内部的 Action 操作划分成多个 job,每个 j…