携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第13天,点击查看活动详情
⭐️前面的话⭐️
✉️坚持和努力一定能换来诗与远方!
💭推荐书籍:📚《王道408》,📚《深入理解 Java 虚拟机-周志明》,📚《Java 核心技术卷》
💬算法刷题:✅力扣🌐牛客网
🎈Github
🎈码云Gitee
安装
环境准备
安装Zookeeper
HBase需要依赖Zookeeper来进行集群内的数据协调。虽然HBase的发布包中内置了Zookeeper,但是在搭建集群时,通常会另外搭建一个Zookeeper集群,减少组件之间的直接依赖。
安装HBase
搭建HBase集群模式
核心概念
- RowKey:HBase 数据库中表示唯一的键
- Column Family(列族):HBase 中的每个列,都属于某一个列族,列族必须在使用表之前定义,列名都以列族作为前缀
- 例如:‘a1:b1’,‘a1:b2’,其中列族是 a1 ,而列族的值为 ‘b1’ 和 ‘b2’
- Cell:表中的单元格,由
{rowkey, column Family:columu, version}唯一确定的单元。 - 命名空间
基础操作
关于HBase的使用,在官网上有一个很重要的文档(下载地址), 这是学习HBase最好的资料。不过这个资料是全英文的,并且内容非常非常多,需要有一定的理解能力。
使用HBase的客户端
#查看HBase基础指令
[root@192-168-65-174 hbase-2.4.4]# bin/hbase --help
#hbase命令行
[root@192-168-65-174 hbase-2.4.4]# bin/hbase shell
#查看帮助
hbase:001:0> help
#列出已有的表
hbase:002:0> list
客户端
HBase支持多种客户端的API操作。从官方文档中可以看到, HBase支持Rest、Thrift、C/C++、Scala、Jython多种客户端。
REST API
Java API
maven 坐标
<dependency>
<groupId>org.apache.hbase</groupId>
<artifactId>hbase-server</artifactId>
<version>2.4.4</version>
</dependency>
<dependency>
<groupId>org.apache.hbase</groupId>
<artifactId>hbase-client</artifactId>
<version>2.4.4</version>
</dependency>
<dependency>
<groupId>org.springframework.data</groupId>
<artifactId>spring-data-hadoop-hbase</artifactId>
<version>2.5.0.RELEASE</version>
</dependency>
调用 HBase 提供的 API 进行数据操作主要记住几个关键对象即可。
例如对HBase的所有操作都基于Connection对象。 表结构管理都通过HBaseAdmin对象来操作,表数据都通过Table对象来操作。