clickHouse 为什么快

627 阅读1分钟
  1. 列式存储 和数据压缩 数据压缩采用LZ4算法

2.向量和执行引擎 用到了cpu的simd(单条指令操作多条数据),通过数据并行的方式提高效率

image.png

3.多样化表引擎 总共有20多种表引擎,适合不同应用场景

4.多线程和分布式 多服务器治理原则:移动程序比移动数据简单;clickhuse预先将数据分布到各个服务器,由各个服务器进行计算;分区:纵向扩展,利用多线程;分片:横向扩展,利用分区

5.多主结构 集群中的每个节点角色对等,不区分主控节点,数据节点和计算节点,天然避免了单点故障,非常适合多数据中心,异地多活等场景