高效分布式JOIN计算
分布式JOIN计算痛点
由于分布式数据库中数据分布在多个节点上,分布式JOIN计算有两个痛点:
- 数据拉取到同一个节点上,耗费大量的网络资源
- 查询语句执行耗时长
TDSQL PostgreSQL解决思路
TDSQL PostgreSQL通过两种技术支撑高效分布式JOIN(多表关联)计算
- 高效全局查询计划。在执行方式上,协调节点接收到用户的SQL请求,根据集群信息,生成最优的分布式查询计划,并下发到参与计算的各个数据节点上执行。即协调节点负责下发执行计划,数据节点负责执行该计划。
- 数据重分布。数据节点之间建立高效数据交换通道,此过程在TDSQL PostgreSQL中被称为数据重分布。
分布式全局一致性
- 两阶段提交
- 全局时钟