Hive JDBC驱动介绍

897 阅读5分钟

Hive JDBC Driver

Hive JDBC驱动简介

Hive是Hadoop生态系统中一个非常重要的服务。Hive JDBC驱动将提供连接外部或内部(超集服务)BI工具的功能。它将有助于分析数据、查询数据和可视化数据。我们可以触发对分布式数据的查询,即存储在HDFS上的数据。JDBC驱动将帮助我们连接到蜂巢服务器2。蜂巢支持两种类型的驱动。第一种类型是JDBC驱动,第二种类型是ODBC驱动。根据项目要求或业务需要,我们需要选择其中任何一种连接类型。但在默认情况下,我们在Hadoop栈中使用JDBC连接。

JDBC驱动如何在Hive中工作?

正如我们已经讨论过的,Hive支持SQL功能。我们可以在分布式数据的基础上触发SQL查询。在Hadoop栈中,我们使用HDFS来存储分布式数据。我们可以通过不同的方式来使用蜂巢服务。这些不同的方式包括HDP环境、CDH环境和独立的蜂巢环境等。要使用Hive JDBC驱动,首先,我们需要了解Hive的架构。在hive服务中,有不同的组件可用,如hive server2、hive metastore、hive metadata、hive thrift server、hive gateway或客户端。

Hive JDBC驱动。JDBC驱动是蜂巢服务的一个非常重要的部分。它将帮助连接蜂巢客户端和蜂巢服务器。

Hive服务器2。蜂巢服务器2在蜂巢服务中起着非常重要的作用。它将管理整个蜂巢服务。它将保持对所有蜂巢组件的完整跟踪。

蜂巢元存储服务。蜂巢元存储服务将管理元存储连接。它将在MySQL服务器、MariaDB、Postgres DB等提供的蜂巢数据库的帮助下管理它。在这个数据库中,蜂巢有实际的元数据。

蜂巢元数据。蜂巢元数据是与蜂巢服务相关的实际物理数据库。为了创建蜂巢元数据,我们需要选择任何一个数据库服务器,如MySQL服务器、MariaDB、Postgres DB等。它有关于蜂巢服务的详细信息。

蜂巢节俭服务器。在蜂巢服务中,蜂巢节俭服务器是一个可选的服务。根据要求或业务需要,我们可以在Hadoop堆栈中安装它。蜂巢漂移服务器将帮助提交来自外部环境的蜂巢查询。如果任何外部软件或工具想要触发蜂巢作业,那么它将在蜂巢节俭服务器的帮助下进行。它将很容易地触发蜂巢服务器上的工作。

Hive客户端或网关。它在当前工作的主机或节点与蜂巢服务器之间提供了一个通信通道2。在hive客户端的帮助下,我们可以在hive服务器上触发hive查询。对于hive JDBC,我们需要有hive JDBC客户端jar。在这个jar的帮助下,我们可以建立JDBC连接并在hive服务器上触发hive查询。

下面是hive JDBC的格式。

序号JDBC参数解释
1Hive节点的主机名这是安装hive server2的集群节点的主机名。我们需要在host参数中传递hostname的值。
2Hive服务器的端口号hive server2在特定的端口上列出(默认是在10000端口上列出)。根据蜂巢服务器的配置,我们需要在这个参数中设置端口值。
3数据库名称我们需要指定hive数据库的名称。我们需要提供相同的数据库名称,以便于我们连接。默认情况下,它将连接到默认的蜂巢数据库。
4会话协议这不是JDBC连接中的强制性参数。根据应用程序的要求,我们需要设置键和值对的值,如<key1> = <value1>; <key2> = <key2> ... ... ...。
5Hive Confs这也是Hive在服务器配置中的可选参数。在这里,我们也需要遵循键和值对的格式,如<key1> = <value1>; <key2> = <key2> ... ... 。

实例

了解Hive JDBC驱动的例子。

Hive JDBC驱动。从Hive服务用户界面

在Hadoop环境中,我们能够获得Hive JDBC的路径。

命令。

它将在Hadoop用户界面上出现。

解释。

我们可以从Hadoop用户界面上获得驱动的JDBC字符串。

输出。

Hive Command 1

Hive JDBC驱动。从Hive Shell

在Hadoop环境中,我们可以从hive shell中获得hive JDBC字符串。

命令。

hive

解释一下。

按照上面的命令,我们能够得到Hive JDBC的连接字符串。

输出。

Hive Command 2

Hive JDBC驱动。从Hive beeline

在hive服务中,我们可以从beeline shell中获得hive JDBC字符串。

命令。

beeline

解释一下。

按照上面的命令,我们能够得到hive JDBC的信息。

输出。

Hive Command 3

hive JDBC驱动的优点

  1. 它将实现从登录主机到hive服务器的通信通道。
  2. 它将有助于登上第三部分的应用程序。
  3. 它可以与Knox等安全服务一起使用。
  4. 它对不同的BI工具有很好的支持。
  5. 我们可以在hive JDBC的帮助下使用外部hive客户端,如squirrel工具。

总结

我们已经看到了 "Hive JDBC驱动 "的完整概念,以及适当的例子、解释和不同输出的命令。它将有助于连接蜂巢服务器。它将很容易地与不同的安全级别的工具集成。在hive JDBC驱动的帮助下,我们可以在不同的BI工具上工作。

推荐文章

这是一个关于Hive JDBC驱动的指南。这里我们讨论了简介,JDBC驱动如何在Hive中工作?例子,以及代码实现。你也可以看看下面的文章,以了解更多信息。

  1. Hive表
  2. HiveQL查询
  3. Hive数据库
  4. Hive时间戳

The postHive JDBC Driverappeared first onEDUCBA.