复杂查询优化之道：金仓数据库基于代价的连接条件下推深度解析复杂查询优化之道：金仓数据库基于代价的连接条件下推深度解析引

复杂查询优化之道：金仓数据库基于代价的连接条件下推深度解析

引言

在数据库领域，教科书上的SQL往往简洁明了，但在真实的业务场景中，SQL却复杂得像是一团“意大利面条”。随着业务逻辑的日益复杂，公用表表达式（CTE）、多层嵌套子查询、窗口函数、各种聚集计算被大量使用。这些手段在提升代码可读性的同时，也给数据库查询优化器带来了巨大的挑战。

一个非常典型的性能瓶颈是：高选择性的过滤条件（JOIN条件或WHERE条件）作用在外层，却无法被“传递”到耗时的内层子查询中，导致子查询不得不处理海量数据，最终拖垮整个查询。

本文将结合金仓数据库（KingbaseES）的最新实践，深入探讨这一痛点，并系统性地介绍我们如何通过 “基于代价的连接条件下推（Cost-based Join Predicate Pushdown）” 技术，在保证语义正确的前提下，实现查询性能数量级的提升。

一、问题背景：被“困”在外层的过滤条件

1.1 一个典型的客户痛点

想象一下，我们经常会在业务中看到类似这样的SQL模式：

SELECT *
FROM (
    -- 复杂的子查询：先对表s1进行去重
    SELECT DISTINCT s1.a, s1.b, s1.c
    FROM s1
    WHERE s1.create_time > '2023-01-01' -- 一个过滤条件
) AS sub_s
-- 外层再与另一个表s2进行JOIN，并带有高选择性的过滤条件
JOIN s2 ON sub_s.a = s2.a
WHERE s2.b = 3; -- 这是一个高选择性的过滤条件，可能只返回几条数据

从业务语义上看，这个SQL逻辑清晰：先从一个时间范围内的数据中找出不重复的记录，再与另一张表关联并筛选特定条件。但从数据库执行的角度看，这隐藏着一个巨大的性能陷阱：

全量计算：数据库必须先执行子查询sub_s，对s1表进行全表扫描和去重操作，生成一个巨大的中间结果集。
后置过滤：然后，数据库才会将这个巨大的中间结果集与s2表进行JOIN，并应用外层的WHERE s2.b = 3条件。
性能灾难：问题的关键在于，外层那个能过滤掉99.9%数据的WHERE条件，对子查询的扫描范围没有任何影响。如果s1表有上亿行数据，那么去重操作本身就是一个灾难，后续的JOIN更是雪上加霜。

根本原因：过滤条件发生得太晚了。

1.2 业界面临的两大技术难点

将JOIN条件下推到子查询内部，让过滤提前发生，听起来是一个很直观的优化方向。但在数据库内核层面，这绝非易事，主要面临两大难题：

难点一：语义安全性（Equivalence）

下推JOIN条件，本质上是改变了谓词（Predicate）生效的位置。如果优化器不够智能，就可能导致SQL的最终结果发生变化，这是绝对不允许的。尤其是在以下复杂结构中，下推操作必须慎之又慎：

含有聚集函数（如 SUM, AVG）
含有窗口函数（如 ROW_NUMBER()）
含有 DISTINCT、UNION 等集合操作
含有非确定性函数（如 RANDOM(), NOW()）

因此，并非所有JOIN条件都能安全地下推，必须有严格的等价性判定机制来把关。

难点二：代价评估（Cost）

即便在语义上等价，下推也未必总是“划算”的。有些情况下，下推可能会带来负面效果：

重复执行的风险：下推后的条件可能会变成参数化执行，如果外层驱动表数据量巨大，会导致内层子查询被反复执行成千上万次。
索引失效的风险：下推后的条件可能无法利用子查询内部已有的索引。

这意味着：JOIN条件下推不仅要“能推”，还要“值得推”。

二、传统方案的局限

传统的查询优化器在面对开头的SQL时，通常束手无策，只能选择一条“朴素”的执行路径：

完整执行子查询：先扫描s1表，执行DISTINCT等复杂操作。
生成大中间结果：将去重后的结果物化为一个巨大的中间结果集（可能是临时文件或内存表）。
最后进行JOIN与过滤：再与s2表进行JOIN，并应用外层的过滤条件。

这条路径的致命伤在于，子查询的输出规模完全不受外层条件约束。当子查询本身计算复杂且数据量庞大时，这个中间结果集就会成为整个查询的性能瓶颈，导致IO和CPU资源耗尽。

三、金仓数据库的创新方案：代价与语义的双重约束

在金仓数据库最新版本中，我们针对这个顽疾，引入了一套全新的 “等价性 + 代价模型”双重约束的连接条件下推机制。我们不再盲目下推，而是像一位经验丰富的DBA一样，先判断“能不能推”，再评估“值不值推”。

整个工作流程如下图所示：

(注：此处可放置一张流程图，展示从SQL解析 -> 等价性判定 -> 生成下推候选路径 -> 代价估算 -> 选择最优计划的流程)

3.1 第一关：能不能推？—— 严格的等价性判定

在这个阶段，优化器的目标不是“尽可能多地推”，而是“只推绝对安全的”。

子查询结构分析：优化器会深入分析子查询的内部结构，判断其是否包含聚集、窗口函数、DISTINCT、UNION等可能阻止下推的“障碍物”。
谓词拆分：将外层的JOIN条件进行拆解，区分出哪些部分依赖于外层表的列（可参数化部分），哪些部分只涉及子查询内部的列。
安全性校验：根据预设的规则集，判断将可参数化部分注入到子查询的特定位置（如扫描或过滤阶段）后，是否会导致结果集发生变化。

只有通过了这一关的JOIN条件，才会被改写成参数化过滤条件，准备注入到子查询中。这一步的核心是保证结果的正确性。

3.2 第二关：值不值推？—— 基于代价的动态决策

通过了等价性校验，并不意味着最终会下推。优化器会进入代价评估阶段，用数据说话，比较下推前后的执行代价。

计算原始代价：估算不下推时的执行成本，包括子查询扫描的行数、中间结果集的大小、JOIN的成本等。
计算下推代价：估算下推后的执行成本。这里会重点评估两点：
- 过滤收益：下推后，子查询扫描阶段能过滤掉多少数据，中间结果集能缩小多少。
- 重复执行成本：由于下推可能导致子查询变成“相关子查询”（参数化执行），需要评估外层表的数据量，计算内层子查询被重复执行的总开销。
成本比较与决策：如果 下推后代价 < 下推前代价，则优化器会选择下推，生成更优的执行计划。否则，即使能推，优化器也会放弃，选择其他路径。

这一步的核心是保证执行的效率，避免好心办坏事。

四、效果验证：从84ms到0.14ms的飞跃

理论需要实践的检验。我们在多个场景下对这一新特性进行了验证，结果令人振奋。

4.1 最小化用例：简单去重场景

SQL

-- 验证场景：s3表有数万行数据
SELECT * 
FROM (SELECT DISTINCT * FROM s3) s3, s1 
WHERE s1.s1a = s3.s3a;

测试结果

未下推时（金仓旧版本 / 其他不支持下推的数据库）：子查询对s3表进行了全表扫描+去重，耗时高达 84ms。中间结果集巨大。
下推后（金仓新版本）：JOIN条件s1.s1a = s3.s3a被下推，在子查询扫描阶段就进行了裁剪，执行时间骤降至 0.14ms。性能提升约600倍！

4.2 复杂场景验证：UNION + 窗口函数

为了模拟真实业务，我们构造了一个包含UNION、DISTINCT、窗口函数和多层子查询的“地狱级”复杂SQL。

SQL

EXPLAIN ANALYZE
SELECT *
FROM (
    -- 左侧复杂子查询：包含UNION和DISTINCT
    SELECT * FROM (SELECT DISTINCT * FROM s3 UNION SELECT DISTINCT * FROM s3 a) s3, s1 
    WHERE s1.s1d = s3.s3a
) s 
JOIN (
    -- 右侧复杂子查询：包含窗口函数
    SELECT * FROM (SELECT s3a, SUM(s3b) OVER (PARTITION BY s3a) s3d FROM s3) s3, s1 
    WHERE s1.s1a = s3.s3a
) j ON s.s3d = j.s3a;

测试结果

未下推时：优化器不得不分别执行两个巨大的子查询，生成两个庞大的中间结果集，最后再进行JOIN。整个过程耗时 1081ms，几乎让查询无法运行。
下推后：JOIN条件成功下推，两个子查询都由“全量扫描”转为“选择性扫描”。中间结果集急剧缩小，最终执行时间仅为 0.23ms。性能提升接近5000倍！

这个对比清晰地展示了，在复杂查询中，能否将过滤条件提前，对性能有着决定性的影响。

五、总结与展望

在复杂查询优化的探索中，我们深刻认识到，连接条件下推绝不仅仅是一个简单的“规则改写”问题，而是一个典型的“成本驱动型优化”问题。

只做规则，不看代价，可能会导致在错误的地方下推，引发灾难性的性能回退（例如，把小表驱动大表变成了大表反复驱动小表）。
只看代价，不保语义，则会直接破坏数据的正确性，这是任何数据库都无法容忍的。

金仓数据库通过 “等价性保障 + 基于代价的决策” 的组合设计，成功地在安全与高效之间找到了平衡点。这一机制能够：

在语义安全的前提下，最大化利用JOIN条件的过滤能力。
显著减少子查询阶段的数据扫描量和中间结果规模。
在复杂SQL场景下，获得数百倍甚至数千倍的性能提升。

这种优化对于OLAP、混合负载以及复杂的报表查询尤为关键。未来，我们将继续深化这一技术方向，探索更多如“谓词推入视图”、“跨CTE的过滤条件推导”等优化手段，为我们的用户带来更快、更稳的数据库内核体验。