HBase 数据库| 豆包MarsCode AI刷题1. 前言HBase 是一个开源的 NoSQL 分布式数据库，它提供

1. 前言

HBase 是一个开源的 NoSQL 分布式数据库，它提供了一种容错的方式来存储大量稀疏数据（大量空数据或不重要的数据中捕获的少量信息，例如在 20 亿条记录中查找 50 个最大的项目，或者查找占庞大集合不到 0.1% 的非零项目）

虽然最近性能有了显著的提升，HBase 还不能直接取代SQL数据库。但如今，它已经应用于多个数据驱动型网站，包括 Facebook的消息平台。

HBase与关系型数据库的对比如下表：

****	HBase	关系型数据库
数据结构	半结构化，无数据类型；按列族稀疏存储，缺省数据不占用存储空间；支持多版本数据;	结构化，数据类型丰富；技完整行存储，缺省的列需要存储占位符；不支持多版本数据;
读写模式	支持按需读写部分列	必须整行读取
事务支持	仅支持单行内原子性	支持完整的事务语义
数据规模	适用于 TB、PB 级海量数据，水平扩展快速平滑	仅适用于 GB、小量 TB 级，扩展过程较复杂
索引支持	仅支持 rowkey 主键索引	支持二级索引

HBase有几个主要特点

存储表的常见方法是序列化每行数据，如下所示：

001:10,smith,Joe,60000;

002:12,Jones,Mary,80000;

003:11,Johnson,Cathy,94000;

004:22,Jones,Bob,55000;

列式数据库将一列的所有值序列化在一起，然后序列化下一列的值，依此类推。对于我们的示例表，数据将以这种方式存储：

10:001,12:002,11:003,22:004;

Smith:001,Jones:002Johnson:003,Jones:004;

Joe:001,Mary:002 Cathy:003,Bob:004;

60000:001,80000:002,94000:003,55000:004;