某些时候,我们在初始化 HBase 表的同时需要向其中快速导入大量的数据(比如搭建压力测试环境),如果我们通过调用 HBase 的 PUT 接口来插入,速度是十分慢的。这个时候我们可以采用 BulkLoad 的方式来快速导入数据。采用 BulkLoad,有以下 2 个优势: BulkLoad 不会写 WAL,也不会产生 flush 以及 split。 如果我们大量调用 PUT 接口插入数据,可能会导致大量的 GC 操作。除了影响性能之外,严重时甚至可能会对 HBase 节点的稳定性造成影响。但是采用 BulkLoad 就不会有这个顾虑。