Clickhouse从入门到入坑(19)

30 阅读2分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 2 月更文挑战」的第 20 天,点击查看活动详情

生命不息,学习不止

题外话

周二了,今天大盘站稳3300点,奥利给,赶紧给呱唧呱唧,但是我有个问题,已经重回3300点了,那为什么我还没有回本,为什么??????

废话不多说,上货

在这里插入图片描述

Distributed表引擎原理

如果使用clickhouse做数据系统的集群项目,Distributed则是必不可少的表引擎

它的作用是将数据分布在多个节点上,以支持分布式计算和查询。Distributed表引擎的原理是通过将表分片并将分片分布在不同的节点上来实现数据的分布式存储和查询。

具体来说,Distributed表引擎分为两部分:分布式表和远程表。分布式表是逻辑上的表,它定义了数据的分片方式和分布式计算的执行方式。远程表是实际存储数据的表,它位于分布式表定义的不同节点上。

当查询Distributed表时,查询请求将被发送到所有分布式表定义的节点上。每个节点将根据自己上的远程表返回一部分查询结果,并将它们汇总到查询协调节点上。查询协调节点最后将所有部分结果组合成最终结果并返回给客户端。

为了确保查询结果的准确性,Distributed表引擎还实现了一些容错机制。例如,如果一个节点在查询过程中发生故障,则查询协调节点将尝试重试查询并从其他节点获取丢失的数据块。

Distributed表引擎支持多种数据分片方式,例如按哈希值、按日期范围、按区域等方式进行分片。根据分片的方式不同,Distributed表引擎还提供了不同的分布式计算策略,例如全局排序、局部排序、合并聚合等。

总的来说,Distributed表引擎通过将数据分布在多个节点上,实现了分布式存储和查询。它还提供了多种数据分片和计算策略,以支持不同类型的查询和应用场景。

你以为结束了

下一篇我们继续挖坑

在这里插入图片描述

大家看完发现有什么错误,写在下面吧!跟我黑虎阿福比划比划! 在这里插入图片描述