首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
小柯_
掘友等级
数仓开发工程师
|
bilibili
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
22
文章 22
沸点 0
赞
22
返回
|
搜索文章
最新
热门
Hive表格式转换
Hive 表有多种存储格式,TextFile、ORC、RCFile等等。 如何对Hive表的存储格式进行修改?
UDF开发手册 - UDAF
init(m,parameters) | 各个模式下,都会调用该方法进行初始化。校验上一阶段的参数,并且决定该阶段的输出
Hive Meta(Hive元数据)
DB_LOCATION_URI | 数据库Location | viewfs://...... LOCATION | 表Location | viewfs://...... RESOURCE_URI | 资源URI | hdfs://...
数据治理 - TextFile格式Hive表压缩优化实践
由于缺少统一的规范落地和平台工具支持,大部分的业务人员、技术人员在建表时并没有考虑到 Hive表 格式的重要性。随着数据量的上升,TextFile格式的存储浪费情况越来越严重 TextFile格式的 Hive表,数据加载速度快。数仓的 ODS层 一般使用 TextFile 格式…
Hive UDF 开发手册
特此整理一番,供自己日后工作参考之用。同时也分享给大家,可以指导初学者开发自定义UDF,也可以作为随用随查的参考手册: 临时函数:只在当前客户端会话中生效的函数,不会影响到其他的会话。客户端退出后,临时函数就失效了 永久函数:注册永久函数后,其他的客户端会话也可以使用这个函数。…
UDF开发手册 - UDTF
其中 process()、close() 为 GenericUDTF 中的抽象方法,必须实现。initialize() 虽然不是抽象方法,但必须手动覆盖实现该方法,因为 GenericUDTF 的 initialize() 最终会抛出一个异常: UDTF函数可以对于一行输入,可…
UDF开发手册 - UDF
initialize() 需要 return 一个 ObjectInspector 实例,用于表示自定义UDF返回值类型。initialize() 的返回值决定了 evaluate() 的返回值类型
Hive:select count(distinct)优化以及hive.groupby.skewindata
好家伙,有一个Reduce Task执行了10个小时,另个一执行了近2小时,其余Reduce Task的执行时间很短。 简而言之:SQL 中的 Group By 字段会决定某条数据最终落在哪一个 Reducer 上处理。 其实 Hive 早就考虑到这个场景,并且贴心的提供了 h…
个人成就
文章被点赞
22
文章被阅读
27,565
掘力值
449
关注了
7
关注者
12
收藏集
1
关注标签
2
加入于
2019-04-29