首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Hive
二十六画生的博客
创建于2021-06-18
订阅专栏
企业级Hive实用技能
暂无订阅
共14篇文章
创建于2021-06-18
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Hive cross join ,结果是笛卡尔积,不能写on字段
Hive cross join ,结果是笛卡尔积,不能写on字段,1 2 on报错 3 t2 cross join t1 end
Hive case when+group by组合使用的问题
0 源表 1 报错,因为没有通过聚合或别名或常量生成新的字段.【5正确】 2 正确 3 正确 4 正确 5 正确
Hive中2列多行转成多列1行
转换成: 方法1: sum(case when...) 2 方法2: sum(map['']) 方法1不带sum的结果,与方法2不带sum的结果 相同,如下:
Hive中2列多行转成多列1行的问题?
select --case --when month = '01' THEN sum_qty --end as '01', --SqlParseException: Sql
Hive concat_ws/collect_set/sort_array/array_contains/str_to_map/map_keys用法
select concat_ws(',', 1, 2, null, 3), --1,2,3 concat_ws(1, 2, null,
Hive count(case when) / count(distinct)用法
count(表达式) : 如果表达式值为NULL则不加1,如果手 select count( case when c1 is not null then c1 else null end )
Hive union all where 是起到全局作用吗?
where条件只对下面的sql起作用。如果使用了()子表查询,那么【where id > 3】会对整个结果起作用
Hive in exists 区别
IN适合于外表大而内表小的情况;EXISTS适合于外表小而内表大的情况。 in /exists / left semi join 不会产生笛卡尔积 ! inner join可能会产生笛卡尔积! 1.
Hive set hive.lzo.paralle.read.index.thread = 1000;
set hive.lzo.paralle.read.index.thread = 1000; 应该是读lzo文件的时候起多个进程去读数据,如果来源表是lzo而且小文件比较多,加这个可以加快速度。 查看
Hive count(*) count(1) count(c1) 区别
1 count(c1) 不统计c1=NULL的记录,但统计c1='' 和 c1=' ' 空格的记录! 2 count(*) = count(1) = count(10000) = count(c1)
Hive 数据倾斜类型转换 string join int -> double / (string + int ) join int -> double
在做大数据的离线开发时,在join后的on关联条件时,2个字段类型不一致,但是自己发现不了,当出现数据倾斜时,仔细排查会发现2个字段的数据类型不一致。此篇文章则是对此类问题作出解释! 同Java语言一
MapReduce报错:java.io.IOException: Split metadata size exceeded 10000000
一、问题现象 客户在用hive sql做几张表的组合分析,使用mr引擎。 因为其中有一张表超过5万个分区,数据总量超过8千亿条,因此运行过程中出现失败,报错如下所示: org.apache.hadoo
Hive cube / rollup / grouping sets/GROUPING__ID用法
cube 是 grouping sets的特例; rollup是cube的特例【rollup只group by 第一个字段开头的字段组合】【rullup函数是cube的子集,以最左侧维度为主,按照顺
Hive load数据到\t分隔的表,字段映射错误怎么解决?
在Mac/Win本地不用修改分隔符,文件rz -be上传到linux目录后,用vim再把字段值分隔符替换为Tab键(:%s/分隔符/Tab键/g),再load,查询的结果才对 【比如文本中是逗号分割的