Hive JDBC驱动简介
Hive是Hadoop生态系统中一个非常重要的服务。Hive JDBC驱动将提供连接外部或内部(超集服务)BI工具的功能。它将有助于分析数据、查询数据和可视化数据。我们可以触发对分布式数据的查询,即存储在HDFS上的数据。JDBC驱动将帮助我们连接到蜂巢服务器2。蜂巢支持两种类型的驱动。第一种类型是JDBC驱动,第二种类型是ODBC驱动。根据项目要求或业务需要,我们需要选择其中任何一种连接类型。但在默认情况下,我们在Hadoop栈中使用JDBC连接。
JDBC驱动如何在Hive中工作?
正如我们已经讨论过的,Hive支持SQL功能。我们可以在分布式数据的基础上触发SQL查询。在Hadoop栈中,我们使用HDFS来存储分布式数据。我们可以通过不同的方式来使用蜂巢服务。这些不同的方式包括HDP环境、CDH环境和独立的蜂巢环境等。要使用Hive JDBC驱动,首先,我们需要了解Hive的架构。在hive服务中,有不同的组件可用,如hive server2、hive metastore、hive metadata、hive thrift server、hive gateway或客户端。
Hive JDBC驱动。JDBC驱动是蜂巢服务的一个非常重要的部分。它将帮助连接蜂巢客户端和蜂巢服务器。
Hive服务器2。蜂巢服务器2在蜂巢服务中起着非常重要的作用。它将管理整个蜂巢服务。它将保持对所有蜂巢组件的完整跟踪。
蜂巢元存储服务。蜂巢元存储服务将管理元存储连接。它将在MySQL服务器、MariaDB、Postgres DB等提供的蜂巢数据库的帮助下管理它。在这个数据库中,蜂巢有实际的元数据。
蜂巢元数据。蜂巢元数据是与蜂巢服务相关的实际物理数据库。为了创建蜂巢元数据,我们需要选择任何一个数据库服务器,如MySQL服务器、MariaDB、Postgres DB等。它有关于蜂巢服务的详细信息。
蜂巢节俭服务器。在蜂巢服务中,蜂巢节俭服务器是一个可选的服务。根据要求或业务需要,我们可以在Hadoop堆栈中安装它。蜂巢漂移服务器将帮助提交来自外部环境的蜂巢查询。如果任何外部软件或工具想要触发蜂巢作业,那么它将在蜂巢节俭服务器的帮助下进行。它将很容易地触发蜂巢服务器上的工作。
Hive客户端或网关。它在当前工作的主机或节点与蜂巢服务器之间提供了一个通信通道2。在hive客户端的帮助下,我们可以在hive服务器上触发hive查询。对于hive JDBC,我们需要有hive JDBC客户端jar。在这个jar的帮助下,我们可以建立JDBC连接并在hive服务器上触发hive查询。
下面是hive JDBC的格式。
| 序号 | JDBC参数 | 解释 |
| 1 | Hive节点的主机名 | 这是安装hive server2的集群节点的主机名。我们需要在host参数中传递hostname的值。 |
| 2 | Hive服务器的端口号 | hive server2在特定的端口上列出(默认是在10000端口上列出)。根据蜂巢服务器的配置,我们需要在这个参数中设置端口值。 |
| 3 | 数据库名称 | 我们需要指定hive数据库的名称。我们需要提供相同的数据库名称,以便于我们连接。默认情况下,它将连接到默认的蜂巢数据库。 |
| 4 | 会话协议 | 这不是JDBC连接中的强制性参数。根据应用程序的要求,我们需要设置键和值对的值,如<key1> = <value1>; <key2> = <key2> ... ... ...。 |
| 5 | Hive Confs | 这也是Hive在服务器配置中的可选参数。在这里,我们也需要遵循键和值对的格式,如<key1> = <value1>; <key2> = <key2> ... ... 。 |
实例
了解Hive JDBC驱动的例子。
Hive JDBC驱动。从Hive服务用户界面
在Hadoop环境中,我们能够获得Hive JDBC的路径。
命令。
它将在Hadoop用户界面上出现。
解释。
我们可以从Hadoop用户界面上获得驱动的JDBC字符串。
输出。
Hive JDBC驱动。从Hive Shell
在Hadoop环境中,我们可以从hive shell中获得hive JDBC字符串。
命令。
hive
解释一下。
按照上面的命令,我们能够得到Hive JDBC的连接字符串。
输出。
Hive JDBC驱动。从Hive beeline
在hive服务中,我们可以从beeline shell中获得hive JDBC字符串。
命令。
beeline
解释一下。
按照上面的命令,我们能够得到hive JDBC的信息。
输出。

hive JDBC驱动的优点
- 它将实现从登录主机到hive服务器的通信通道。
- 它将有助于登上第三部分的应用程序。
- 它可以与Knox等安全服务一起使用。
- 它对不同的BI工具有很好的支持。
- 我们可以在hive JDBC的帮助下使用外部hive客户端,如squirrel工具。
总结
我们已经看到了 "Hive JDBC驱动 "的完整概念,以及适当的例子、解释和不同输出的命令。它将有助于连接蜂巢服务器。它将很容易地与不同的安全级别的工具集成。在hive JDBC驱动的帮助下,我们可以在不同的BI工具上工作。
推荐文章
这是一个关于Hive JDBC驱动的指南。这里我们讨论了简介,JDBC驱动如何在Hive中工作?例子,以及代码实现。你也可以看看下面的文章,以了解更多信息。
The postHive JDBC Driverappeared first onEDUCBA.