Hadoop - Hive的配置管理

331 阅读1分钟

Hive的配置管理

  1. 默认情况下,Hive是从Hive的安装路径下的子路径conf下的文件hive.default.xml获取配置信息的。
  2. Hive的配置文件的位置可以通过HIVE_CONF_DIR来指定。
  3. 环境变量相关的配置信息可以在子路径conf下的hive-site.xml文件中重定义。
  4. log4j的配置存储在子路径conf下的hive-log4j.properties文件中。
  5. Hive的配置信息是对Hadoop配置的一个继承,Hive默认会使用Hadoop的环境变量。
  6. 修改Hive的环境变量:
    • 编辑hive-site.xml文件,修改Hive/Hadoop的环境变量。
    • 使用set命令设置环境变量。
    • Hive,Beeline,HiveServer2这些都可以使用如下的语法来传递配置信息:
      • bin/hive --hiveconf x1=y1 --hiveconf x2=y2  //this sets the variables x1 and x2 to y1 and y2 respectively
      • bin/hiveserver2 --hiveconf x1=y1 --hiveconf x2=y2  //this sets server-side variables x1 and x2 to y1 and y2 respectively
      • bin/beeline --hiveconf x1=y1 --hiveconf x2=y2  //this sets client-side variables x1 and x2 to y1 and y2 respectively
  7. --hiveconf x1=y1 --hive的方式形式设置HIVE_OPTS环境变量。

运行时配置

  1. Hive的查询是通过MapRed的方式查询的,所以此类查询的行为可以通过Hadoop的环境变量来控制。
  2. Beeline(HiveCLI 废弃了)可以通过执行SET命令来设置Hadoop/Hive的任何环境变量。
beeline> SET mapred.job.tracker=myhost.mycompany.com:50030;
beeline> SET -v;

SET -v显示所有当前设置。 如果没有 -v 选项,只会显示与基本 Hadoop 配置不同的变量。