大数据BigData之hive的执行过程是怎么样的?(概括)

778 阅读1分钟

hive的执行过程,大体上是这样的:

  1. hive 客户端(一般是hive cli,入口类为CliDriver)把HQL翻译成MR执行计划(Operator树)并序列化到 plan.xml
  2. plan.xml 上传到hdfs上
  3. hive 客户端新起一进程,提交MapReduce程序,其入口类为ExecDriver,ExecDriver的Mapper会在setup阶段读取plan.xml,反序列化成Operator树结构,然后执行。