首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大数据阶梯之路
掘友等级
数仓开发工程师
笔耕大数据技术领域,擅长大数据数据仓库体系 分享 数仓建设/数据开发/数据治理/数据架构/面试经验
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
6
文章 6
沸点 0
赞
6
返回
|
搜索文章
最新
热门
hiveQL实战操作
用来向hive装载数据,不过注意这操作不是把数据复制到表中,而是把文件和表建立起关联,当访问表的时候就去查询hdfs的数据。 参数说明:如果加上local则支持用户从其本地文件装载数据(eg:file:///user/hive/example),如果没有local则从Hadoo…
数据倾斜
大批数据量处理然后分区不均衡的情况下就会造成集群某台机器超负荷工作,而某台机器却零负荷,即运作分配不均衡,忙的忙死,闲的闲死,这就是数据倾斜的情况,主要是数据的key分配严重不均。数据倾斜情况的很大表现是:部分task执行的很快,剩下几个task执行得特别慢。减少数据量就能一定…
时间相关的函数
将字符型转换为指定格式的日期型数据,输出的格式为带横杠日期。 把日期格式化成字符串,这个函数解决了我实际需求去掉日期格式不要横杠问题。 把unix时间戳转换为日期格式。 把日期转换成unix时间戳,很多时候业务系统那边的数据都是时间戳格式的数据,我们无法直接使用日期来筛选数据,…
个人成就
文章被阅读
2,643
掘力值
53
关注了
1
关注者
1
收藏集
0
关注标签
8
加入于
2019-01-23