首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Hive干货合集
智海观潮
创建于2025-09-15
订阅专栏
Hive干货合集
暂无订阅
共5篇文章
创建于2025-09-15
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Hive Join优化
在阐述Hive Join具体的优化方法之前,首先看一下Hive Join的几个重要特点,在实际使用时也可以利用下列特点做相应优化:1.只支持等值连接2.底层会将写的HQL语句转换为MapReduce,
Apache Hive
Apache Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供一种HQL语言进行查询,具有扩展性好、延展性好、高容错等特点,多应用于离线数仓建设。 1.
Hive数据导入HBase引起数据膨胀引发的思考
在实际生产环境,通常将计算和存储进行分离,保证集群规模水平可扩展,易于提高整体的吞吐。通过单机性能优化和集群的扩容,确保业务大幅增长时,存储不能没有成为系统的瓶颈 当然,除了上述原因,还有很多涉及底层的原理环节和实际的业务场景需求,这就要求我们对HBase有足够的了解。
Hive建表时开启事务机制导致insert失败
Hive建表语句指定tblproperties('transactional'='true'),则执行插入操作时,不能直接使用insert..values语句,原因是开启了事务机制。建议使用insert..select方式。
大数据调优 | Hive Join优化
jvm重用。可在hadoop的mapred-site.xml中设置jvm被重用的次数,参数mapred.job.reuse.jvm.num.tasks 4.尽量使用left semi join 替代in、not in、exists。 5.当多个表进行查询时,从左到右表的大小顺序…