hive - 用户1219177148486的收藏集 - 掘金

hive

用户1219177148486

更多收藏集

27篇文章 · 0订阅

大数据平台搭建 | Hive

本质就是存储了Hdfs文件和表、数据库之间的映射关系(元数据), 然后提供了以SQL的方式去访问文件数据, 就跟访问表结构化数据一样. 它通过翻译SQL然后通过计算引擎去计算得到查询结果元数据MetaStore: 就是Hdfs文件和表、数据库之间的映射关系数据. 默认存储在自…

李白的手机
5年前
2.1k
4
1

大数据-13-Hive 启动Hive DDL DML 增删改查操作Hive的HQL

通过在命令行输入 hive 进入交互式界面后，用户可执行数据定义语言（DDL）操作，如创建/删除数据库与表，支持内部表和外部表管理。随后介绍了数据操作语言（DML），包括从本地或 HDFS 加载数据

武子康
9月前
151
2
评论

大数据-13-Hive 启动Hive DDL DML 增删改查操作Hive的HQL

Hive从入门到放弃——经典面试题：ORDER BY, SORT BY, DISTRIBUTE BY, CLUSTER BY的区别(十)

如果hive面试，基本都会问一下ORDER BY, SORT BY, DISTRIBUTE BY, CLUSTER BY的区别，那这里就简单给大家做个介绍；

若隐_RowYet_大数据
3年前
459
2
评论

Apache Hive 中 order by、sort by、distribute by、cluster by的区别是什么？

Apache Hive 中四个常见的 by 有什么区别：order by、sort by、distribute by、cluster by

Shockang
4年前
3.0k
4
评论

常见的数据压缩算法有哪些？Hive 的数据压缩格式怎么选择？

常见的数据压缩算法有哪些？压缩模式可以从哪些角度进行评价？Apache Hive 可以使用哪些数据压缩算法？

Shockang
4年前
3.1k
2
1

Hive企业级性能优化（好文建议收藏）

Hive作为大数据平台举足轻重的框架，以其稳定性和简单易用性也成为当前构建企业级数据仓库时使用最多的框架之一。但是如果我们只局限于会使用Hive，而不考虑性能问题，就难搭建出一个完美的数仓，所以Hi

五分钟学大数据
4年前
2.6k
12
评论

一篇文章搞懂 Hive 的调优思路【思维导图，建议收藏】

Apache Hive怎么进行企业级的调优？生产环境的 Apache Hive 如果真的要进行调优，收藏本文，你一定能找到答案

Shockang
4年前
919
1
评论

揭秘 Hive 是如何将 SQL 转换为 MapReduce 的背后技术

在大数据处理的世界里，Hive 无疑是一个不可或缺的工具。作为一个构建在 Hadoop 之上的数据仓库系统，Hive 不仅仅是一个查询工具，它的真正核心是能够将结构化数据转换为 MapReduce 任

齐朋
1年前
331
2
1

揭秘 Hive 是如何将 SQL 转换为 MapReduce 的背后技术

Hive安装与启动

在配置Hive之前一般都需要安装和配置MySQL，因为Hive为了能操作HDFS上的数据集，那么他需要知道数据的切分格式，如行列分隔符，存储类型，是否压缩，数据的存储地址等信息。

RuoZoe
2年前
1.4k
2
评论

配置Hive使用Spark执行引擎

在Hive中，可以通过配置来指定使用不同的执行引擎。Hive执行引擎包括：默认MR、tez、spark。

CodeDevMaster
2年前
1.6k
2
评论