hive - Paul就是我的收藏集 - 掘金

hive

更多收藏集

3篇文章 · 0订阅

Hive 系列（八）—— Hive 数据查询详解

为了演示查询操作，这里需要预先创建三张表，并加载测试数据。 Hive 支持使用 DISTINCT 关键字去重。分区查询 (Partition Based Queries)，可以指定某个分区或者分区范围。 Hive 支持使用 GROUP BY 进行分组聚合操作。 hive.ma…

zed
5年前
461
1
评论

Hive 系列（一）—— Hive 简介及核心概念

Hive 是一个构建在 Hadoop 之上的数据仓库，它可以将结构化的数据文件映射成表，并提供类 SQL 查询功能，用于查询的 SQL 语句会被转化为 MapReduce 作业，然后提交到 Hadoop 上运行。执行延迟高，不适合做数据的实时处理，但适合做海量数据的离线处理。…

heibaiying
6年前
2.8k
8
2

Hive 系列（四）—— Hive 常用 DDL 操作

默认行为是 RESTRICT，如果数据库中存在表则删除失败。要想删除库及其中的表，可以使用 CASCADE 级联删除。通过指定一个或者多个列经常出现的值（严重偏斜），Hive 会自动将涉及到这些值的数据拆分为单独的文件。在查询时，如果涉及到倾斜值，它就直接从独立文件中获取数据…

heibaiying
6年前
3.5k
1
评论