TDSQL PostgreSQL-产品概述

322 阅读1分钟

高效分布式JOIN计算

分布式JOIN计算痛点

由于分布式数据库中数据分布在多个节点上,分布式JOIN计算有两个痛点:

  1. 数据拉取到同一个节点上,耗费大量的网络资源
  2. 查询语句执行耗时长

TDSQL PostgreSQL解决思路

TDSQL PostgreSQL通过两种技术支撑高效分布式JOIN(多表关联)计算

  1. 高效全局查询计划。在执行方式上,协调节点接收到用户的SQL请求,根据集群信息,生成最优的分布式查询计划,并下发到参与计算的各个数据节点上执行。即协调节点负责下发执行计划,数据节点负责执行该计划。
  2. 数据重分布。数据节点之间建立高效数据交换通道,此过程在TDSQL PostgreSQL中被称为数据重分布。

分布式全局一致性

  1. 两阶段提交
  2. 全局时钟