Hive的配置管理
- 默认情况下,Hive是从Hive的安装路径下的子路径
conf下的文件hive.default.xml获取配置信息的。 - Hive的配置文件的位置可以通过
HIVE_CONF_DIR来指定。 - 环境变量相关的配置信息可以在子路径
conf下的hive-site.xml文件中重定义。 - log4j的配置存储在子路径
conf下的hive-log4j.properties文件中。 - Hive的配置信息是对Hadoop配置的一个继承,Hive默认会使用Hadoop的环境变量。
- 修改Hive的环境变量:
- 编辑
hive-site.xml文件,修改Hive/Hadoop的环境变量。 - 使用
set命令设置环境变量。 Hive,Beeline,HiveServer2这些都可以使用如下的语法来传递配置信息:bin/hive --hiveconf x1=y1 --hiveconf x2=y2 //this sets the variables x1 and x2 to y1 and y2 respectivelybin/hiveserver2 --hiveconf x1=y1 --hiveconf x2=y2 //this sets server-side variables x1 and x2 to y1 and y2 respectivelybin/beeline --hiveconf x1=y1 --hiveconf x2=y2 //this sets client-side variables x1 and x2 to y1 and y2 respectively
- 编辑
- 以
--hiveconf x1=y1 --hive的方式形式设置HIVE_OPTS环境变量。
运行时配置
- Hive的查询是通过MapRed的方式查询的,所以此类查询的行为可以通过Hadoop的环境变量来控制。
- Beeline(HiveCLI 废弃了)可以通过执行
SET命令来设置Hadoop/Hive的任何环境变量。
beeline> SET mapred.job.tracker=myhost.mycompany.com:50030;
beeline> SET -v;
SET -v显示所有当前设置。 如果没有 -v 选项,只会显示与基本 Hadoop 配置不同的变量。