一、系统介绍
Hive是一个构建在Hadoop上的数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
广义上的Hive分为两个部分Hive Client和Hive MetaStore。前者负责SQL解析并将SQL转换成MapReduce作业进行逻辑计算。Hive MetaStore负责元数据的存储和权限管理。本文主要介绍前者,基于 Hive on MapReduce。
Hive是一个构建在Hadoop上的数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
广义上的Hive分为两个部分Hive Client和Hive MetaStore。前者负责SQL解析并将SQL转换成MapReduce作业进行逻辑计算。Hive MetaStore负责元数据的存储和权限管理。本文主要介绍前者,基于 Hive on MapReduce。