Hive

Hive

Hive

企业级Hive实用技能

暂无订阅共14篇文章创建于2021-06-18

Hive cross join ，结果是笛卡尔积，不能写on字段

Hive cross join ，结果是笛卡尔积，不能写on字段,1 2 on报错 3 t2 cross join t1 end

3年前
460
点赞
评论

Hive case when+group by组合使用的问题

0 源表 1 报错，因为没有通过聚合或别名或常量生成新的字段.【5正确】 2 正确 3 正确 4 正确 5 正确

4年前
810
点赞
评论

Hive中2列多行转成多列1行

转换成：方法1: sum(case when...) 2 方法2: sum(map['']) 方法1不带sum的结果，与方法2不带sum的结果相同，如下：

4年前
658
1
评论

Hive中2列多行转成多列1行的问题?

select --case --when month = '01' THEN sum_qty --end as '01', --SqlParseException: Sql

4年前
274
点赞
评论

Hive concat_ws/collect_set/sort_array/array_contains/str_to_map/map_keys用法

select concat_ws(',', 1, 2, null, 3), --1,2,3 concat_ws(1, 2, null,

4年前
1.1k
点赞
评论

Hive count(case when) / count(distinct)用法

count(表达式) : 如果表达式值为NULL则不加1，如果手 select count( case when c1 is not null then c1 else null end )

5年前
1.9k
1
评论

Hive union all where 是起到全局作用吗？

where条件只对下面的sql起作用。如果使用了()子表查询，那么【where id > 3】会对整个结果起作用

5年前
227
1
评论

Hive in exists 区别

IN适合于外表大而内表小的情况；EXISTS适合于外表小而内表大的情况。 in /exists / left semi join 不会产生笛卡尔积！ inner join可能会产生笛卡尔积！ 1.

5年前
2.3k
2
评论

Hive set hive.lzo.paralle.read.index.thread = 1000；

set hive.lzo.paralle.read.index.thread = 1000; 应该是读lzo文件的时候起多个进程去读数据，如果来源表是lzo而且小文件比较多，加这个可以加快速度。查看

5年前
309
1
评论

Hive count(*) count(1) count(c1) 区别

1 count(c1) 不统计c1=NULL的记录，但统计c1='' 和 c1=' ' 空格的记录！ 2 count(*) = count(1) = count(10000) = count(c1)

5年前
620
1
评论

Hive 数据倾斜类型转换 string join int -＞ double / (string + int ) join int -＞ double

在做大数据的离线开发时，在join后的on关联条件时，2个字段类型不一致，但是自己发现不了，当出现数据倾斜时，仔细排查会发现2个字段的数据类型不一致。此篇文章则是对此类问题作出解释！同Java语言一

5年前
642
1
评论

MapReduce报错：java.io.IOException: Split metadata size exceeded 10000000

一、问题现象客户在用hive sql做几张表的组合分析，使用mr引擎。因为其中有一张表超过5万个分区，数据总量超过8千亿条，因此运行过程中出现失败，报错如下所示： org.apache.hadoo

5年前
715
1
评论

Hive cube / rollup / grouping sets/GROUPING__ID用法

cube 是 grouping sets的特例； rollup是cube的特例【rollup只group by 第一个字段开头的字段组合】【rullup函数是cube的子集,以最左侧维度为主,按照顺

5年前
1.0k
2
评论

Hive load数据到\t分隔的表，字段映射错误怎么解决？

在Mac/Win本地不用修改分隔符，文件rz -be上传到linux目录后，用vim再把字段值分隔符替换为Tab键（:%s/分隔符/Tab键/g），再load，查询的结果才对【比如文本中是逗号分割的

5年前
620
1
评论