深度剖析 SQL JOIN：底层机制与性能优化策略前言-join是什么 join是用于，将多个表中的数据依据一定的关联条

前言-join是什么

join是用于，将多个表中的数据依据一定的关联条件进行组合。往往我们用于做条件的等值关联。（不等值的结果集往往非常大）。但不同join sql之间的性能天差地别，让我们看看深入理解join的底层机制，合理的使用join语法。

join的方式

可以想到，join的工作可以被拆解成两步，

字段匹配：根据条件匹配，不同表的数据
表合并：将匹配的数据，以及不同表的数据项合并成一张虚拟表

而优化join的关键，就在于理解字段匹配的机制。

`字段匹配`逻辑

而多张表的匹配，可以想到，可拆解成，先用一张表，作为待匹配集，也被称为驱动表。然后再循环匹配剩下n-1张表。剩下n-1张表，也称为被驱动表。

Nested Loop Join

细分类型

Nested Loop Join（嵌套循环连接）MySQL 5.6 支持，可细分为以下几种类型：

Simple Nested Loop Join：最为基础的嵌套循环，时间复杂度O(n²)。外层表的每一行都会和内层表的所有行进行比较。一般不会用这种方法。
Index Nested Loop Join：若被驱动表存在索引，MySQL 会利用该索引来加速匹配，从而减少被驱动表的扫描行数。而驱动表是一定要被全表扫描，加载到join_buffer中的。
Block Nested Loop Join：当没有合适的索引时，MySQL 会使用该算法。它会把驱动表数据缓存。然后内层表进行匹配，以此来减少内层表的扫描次数。

Index Nested Loop Join

驱动表如果有索引，也可能走索引。被驱动表也会根据索引，去拉取数据匹配。

Block Nested Loop Join

会先读驱动表，如果驱动表太大，会分多次读入join_buffer。
每次读入join_buffer的数据，我们称为一个数据块(block)。每个数据块会和被驱动表匹配一次，直到数据读完
所以这里会优先选择小表当驱动表

Hash Join

在 MySQL 5.6 里，Hash Join 默认是不支持的。Hash Join 是一种更为高效的连接算法，它先对其中一个表构建哈希表，接着再用另一个表去匹配该哈希表，从而减少比较次数。从 MySQL 5.7 开始，InnoDB 存储引擎才支持 Hash Join。

例子

SELECT ... FROM R LEFT JOIN S ON R.x = S.x WEHRE ... -R是驱动表

SELECT ... FROM R RIGHT JOIN S ON R.x = S.x WEHRE ... -S是驱动表

SELECT ... FROM R INNER JOIN S ON R.x = S.x WEHRE ... -DB会根据算法，选择驱动表

DB选择驱动表的原则

谁要查询的数据少，谁就是驱动表

Hash Join

hash join用于连接两张表之间，没有索引的情况。

如果强行创建索引，会有问题：

如果有些列是低选择度的索引，那么创建索引在导入数据时要对数据排序，影响导入性能；
二级索引会有回表问题，若筛选的数据量比较大，则直接全表扫描会更快。

具体过程

扫描驱动表，将其中的key value hash起来
扫描第二张表，根据hash表匹配

总结

JOIN 概述：JOIN 用于依据关联条件组合多表数据，常采用等值关联
JOIN 工作步骤：可拆分为字段匹配和表合并两步，优化关键在于理解字段匹配机制。
字段匹配逻辑：多表匹配时，选择一张表作为驱动表，其余为被驱动表，依次循环匹配。
Nested Loop Join：MySQL 5.6 支持，分为 Simple、Index 和 Block Nested Loop Join 三种。Index 类型借助内层表索引加速匹配；Block 类型在无合适索引时，将外层表部分数据加载到缓存匹配，减少扫描次数。
Hash Join：MySQL 5.7 起 InnoDB 存储引擎支持。适用于表间无索引的情况，强行创建索引可能影响导入性能或因回表问题降低效率。其过程是先扫描驱动表构建哈希表，再用另一张表匹配。
驱动表选择原则：数据库通常选择查询数据少的表作为驱动表。
使用建议：业务中使用 JOIN 时，要确保驱动表和被驱动表选择正确，并创建预期内的索引。

深度剖析 SQL JOIN：底层机制与性能优化策略

前言-join是什么

join的方式

字段匹配逻辑

Nested Loop Join

细分类型

Index Nested Loop Join

Block Nested Loop Join

Hash Join

例子

DB选择驱动表的原则

Hash Join

具体过程

总结

`字段匹配`逻辑