首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
怀瑾握瑜的嘉与嘉
掘友等级
大数据萌新,期待与您共同成长
获得徽章 9
动态
文章
专栏
沸点
收藏集
关注
作品
赞
658
文章 649
沸点 9
赞
658
返回
|
搜索文章
最新
热门
spark调优(四):瘦身任务主体
「这是我参与11月更文挑战的第14天,活动详情查看:2021最后一次更文挑战」 1. 起因 刚接触大数据的时候,第一个接手的项目,好家伙,上来就打成一个zip包,200多M,每次打包需要等半天,每次提
spark调优(三):持久化减少二次查询
「这是我参与11月更文挑战的第13天,活动详情查看:2021最后一次更文挑战」 1. 起因 在我们接收到数据的时候,通常都需要etl处理一下,但原始数据最好也是入库保存一下最好,这样一份数据,我们就使
spark调优(二):UDF减少JOIN和判断
「这是我参与11月更文挑战的第12天,活动详情查看:2021最后一次更文挑战」 1. 起因 平时写sql语句的时候经常会有大表与小标做关联查询,然后再进行group by等逻辑分组处理,或者是有很多判
spark调优(一):从hql转向代码
「这是我参与11月更文挑战的第11天,活动详情查看:2021最后一次更文挑战」 1. 起因 日常大数据的处理,常见的数据输出就是最大最小值,求个和,求个平均数这种,常见的写法,写个hql,先分个组,在
Container killed by YARN for exceeding memory limits
「这是我参与11月更文挑战的第10天,活动详情查看:2021最后一次更文挑战」 经常我们提交任务到 yarn上后出现 内存溢出的错误 类似 这个错误总会使你的job夭折。它的意思是:因为超出内存限制,
Hive的UDF
「这是我参与11月更文挑战的第9天,活动详情查看:2021最后一次更文挑战」 我们学习hadoop的时候,为了让我们不太会java语言但是对SQL很熟悉的工程师能够操作基本的mapreduce计算过程
Non-terminating decimal expansion; no exact representable decimal result异常的解决方法
java.lang.ArithmeticException: Non-terminating decimal expansion; no exact representable decimal res
关于spark.sql.autoBroadcastJoinThreshold设置
今天使用spark对一组大数据进行合并作join操作,一直都报下面的错: 问题来分析说是内存溢出了,也就是说明广播内存不够用。但我不断设整任务的内存资源,无论是executor还是driver的内存都
hive数据导入:从查询数据导入
「这是我参与11月更文挑战的第8天,活动详情查看:2021最后一次更文挑战」 1. 创建表的时候从其他表直接导入 该方法是创建新表的同时,直接读取旧表的字段和数据,常见的应用场景就是快速抽取数据做测试
hive数据导入:文件导入
「这是我参与11月更文挑战的第7天,活动详情查看:2021最后一次更文挑战」 1. 从本地文件系统导入数据到hive表 PS.注意,改方法已经在hdp3.x中不支持使用,所以这里不详细说明 基础语法如
下一页
个人成就
文章被点赞
467
文章被阅读
21,496
掘力值
1,104
关注了
32
关注者
28
收藏集
0
关注标签
8
加入于
2021-11-16