HIVE-Client架构

98 阅读1分钟

一、系统介绍

Hive是一个构建在Hadoop上的数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。

广义上的Hive分为两个部分Hive Client和Hive MetaStore。前者负责SQL解析并将SQL转换成MapReduce作业进行逻辑计算。Hive MetaStore负责元数据的存储和权限管理。本文主要介绍前者,基于 Hive on MapReduce。

二、Hive Client(客户端) 在离线大数据平台中的定位

图片.png

三、Hive Client(客户端) 运行时架构图

图片.png

四、Hive Client 数据流图

图片.png