首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Hive
IvanCodes
创建于2026-03-27
订阅专栏
专注 Hive 技术栈,从底层原理到生产实践,拆解 SQL 优化、性能调优与大数据架构设计。用最直白的方式讲清复杂问题,帮你少踩坑、多提效。
等 1 人订阅
共6篇文章
创建于2026-03-27
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
六、Hive 分桶
当分区已经无法满足性能需求时,数据还可以继续被细化拆分。分桶正是在这种场景下出现的一种优化手段,让数据分布更加均匀。
五、Hive表类型、分区及数据加载
在 Hive 的实际使用中,数据如何存储与划分往往决定了后续查询效率。理解内部表与外部表的差异,以及分区策略的应用,是提升性能的关键一步。
四、Hive DDL表定义、数据类型、SerDe 与分隔符核心
随着对 Hive 使用的深入,表结构设计成为核心环节。我们这次从建表方式入手,结合数据类型与读写机制,对相关要点进行简要梳理。
三、Hive DDL数据库操作
在使用 Hive 进行数据分析时,数据库承担着数据分类与管理的核心角色。无论是表的创建还是数据的组织,都离不开数据库这一层结构。
二、Hive安装部署详细过程
在构建大数据分析平台时,Hive 是不可或缺的一环。通过规范的安装与配置流程,可以快速搭建起可用的数仓环境。本文将围绕 Hive 的安装、配置及工具连接,带你一步步完成整体环境搭建。
一、数据仓库基石:核心理论、分层艺术与 ETL/ELT 之辨
数据仓库不是数据库的升级,而是面向决策的大脑。本篇带你快速厘清数据库 vs 数仓、分层架构逻辑、ETL/ELT区别,轻松建立数据思维骨架。