开启掘金成长之旅!这是我参与「掘金日新计划 · 2 月更文挑战」的第 10 天,点击查看活动详情
生命不息,学习不止
题外话
周六了,美好的双休日开始了,本想一觉睡到自然醒,但是某个可恶的生物,大早上就开始扒拉你,提示你该铲屎了,该添饭了,是不是?可恶的喵星人
废话不多说,上货
表引擎
表引擎是实际存储数据的部分,它确定了如何存储数据,如何访问数据以及如何处理数据。ClickHouse支持多种不同的表引擎,每种引擎都有不同的特性和优点,适用于不同的场景。
下面介绍ClickHouse最重要的表引擎:
- MergeTree:这是ClickHouse最常用的表引擎,支持数据的快速查询和排序。它使用了分块存储和压缩算法,以提高存储效率。
MergeTree引擎的基本原理是通过利用排序合并(sort-merge)算法来维护一个有序的数据表。该引擎将数据表划分成多个“块”,并在块内进行排序。对于不同的块,该引擎按照设定的顺序对数据进行排序,以便后续的快速查询。当插入数据时,MergeTree引擎将数据插入到适当的块中,并且在块内保持排序。
当块的大小超过预先设定的阈值时,MergeTree引擎会对这个块进行分裂,并将分裂后的数据保存到两个新的块中。这样,MergeTree引擎可以维护一个高效的数据存储结构,并且支持快速的插入和查询操作。
另外,MergeTree引擎还支持聚合操作,这使得它在处理海量数据的场景下非常有用。它可以快速地执行聚合操作,如求和、平均值等,并且可以提供有关整个数据集的统计信息。
你以为结束了
下一篇我们继续挖坑
大家看完发现有什么错误,写在下面吧!跟我黑虎阿福比划比划!