首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
hive
订阅
用户1219177148486
更多收藏集
微信扫码分享
微信
新浪微博
QQ
27篇文章 · 0订阅
大数据平台搭建 | Hive
本质就是存储了Hdfs文件和表、数据库之间的映射关系(元数据), 然后提供了以SQL的方式去访问文件数据, 就跟访问表结构化数据一样. 它通过翻译SQL然后通过计算引擎去计算得到查询结果 元数据MetaStore: 就是Hdfs文件和表、数据库之间的映射关系数据. 默认存储在自…
大数据-13-Hive 启动Hive DDL DML 增删改查 操作Hive的HQL
通过在命令行输入 hive 进入交互式界面后,用户可执行数据定义语言(DDL)操作,如创建/删除数据库与表,支持内部表和外部表管理。随后介绍了数据操作语言(DML),包括从本地或 HDFS 加载数据
Hive从入门到放弃——经典面试题:ORDER BY, SORT BY, DISTRIBUTE BY, CLUSTER BY的区别(十)
如果hive面试,基本都会问一下ORDER BY, SORT BY, DISTRIBUTE BY, CLUSTER BY的区别,那这里就简单给大家做个介绍;
Apache Hive 中 order by、sort by、distribute by、cluster by的区别是什么?
Apache Hive 中 四个常见的 by 有什么区别:order by、sort by、distribute by、cluster by
常见的数据压缩算法有哪些?Hive 的数据压缩格式怎么选择?
常见的数据压缩算法有哪些?压缩模式可以从哪些角度进行评价?Apache Hive 可以使用哪些数据压缩算法?
Hive企业级性能优化(好文建议收藏)
Hive作为大数据平台举足轻重的框架,以其稳定性和简单易用性也成为当前构建企业级数据仓库时使用最多的框架之一。 但是如果我们只局限于会使用Hive,而不考虑性能问题,就难搭建出一个完美的数仓,所以Hi
一篇文章搞懂 Hive 的调优思路【思维导图,建议收藏】
Apache Hive怎么进行企业级的调优?生产环境的 Apache Hive 如果真的要进行调优,收藏本文,你一定能找到答案
揭秘 Hive 是如何将 SQL 转换为 MapReduce 的背后技术
在大数据处理的世界里,Hive 无疑是一个不可或缺的工具。作为一个构建在 Hadoop 之上的数据仓库系统,Hive 不仅仅是一个查询工具,它的真正核心是能够将结构化数据转换为 MapReduce 任
Hive安装与启动
在配置Hive之前一般都需要安装和配置MySQL,因为Hive为了能操作HDFS上的数据集,那么他需要知道数据的切分格式,如行列分隔符,存储类型,是否压缩,数据的存储地址等信息。
配置Hive使用Spark执行引擎
在Hive中,可以通过配置来指定使用不同的执行引擎。Hive执行引擎包括:默认MR、tez、spark。