图解 SQL 里的各种 JOIN

676 阅读7分钟
原文链接: mp.weixin.qq.com

从业以来主要在做客户端,用到的数据库都是表结构比较简单的 SQLite,以我那还给老师一大半的 SQL 水平倒也能对付。现在偶尔需要到后台的 SQL Server 里追查一些数据问题,就显得有点捉襟见肘了,特别是各种 JOIN,有时候傻傻分不清楚,于是索性弄明白并做个记录。

前言

在各种问答社区里谈及 SQL 里的各种 JOIN 之间的区别时,最被广为引用的是 CodeProject 上 C.L. Moffatt 的文章 Visual Representation of SQL Joins,他确实讲得简单明了,使用文氏图来帮助理解,效果明显。本文将沿用他的讲解方式,稍有演绎,可以视为该文较为粗糙的中译版。

约定

下文将使用两个数据库表 Table_A 和 Table_B 来进行示例讲解,其结构与数据分别如下:

  1. mysql> SELECT * FROM Table_A ORDER BY PK ASC;

  2. +----+------------+

  3. | PK | Value      |

  4. +----+------------+

  5. |  1 | FOX        |

  6. |  2 | COP        |

  7. |  3 | TAXI       |

  8. |  4 | LINCION    |

  9. |  5 | ARIZONA    |

  10. |  6 | WASHINGTON |

  11. |  7 | DELL       |

  12. | 10 | LUCENT     |

  13. +----+------------+

  14. 8 rows in set (0.00 sec)

  15. mysql> SELECT * from Table_B ORDER BY PK ASC;

  16. +----+-----------+

  17. | PK | Value     |

  18. +----+-----------+

  19. |  1 | TROT      |

  20. |  2 | CAR       |

  21. |  3 | CAB       |

  22. |  6 | MONUMENT  |

  23. |  7 | PC        |

  24. |  8 | MICROSOFT |

  25. |  9 | APPLE     |

  26. | 11 | SCOTCH    |

  27. +----+-----------+

  28. 8 rows in set (0.00 sec)

常用的 JOIN

INNER JOIN

INNER JOIN 一般被译作内连接。内连接查询能将左表(表 A)和右表(表 B)中能关联起来的数据连接后返回。

文氏图:

示例查询:

  1. SELECT A.PK AS A_PK, B.PK AS B_PK,

  2.       A.Value AS A_Value, B.Value AS B_Value

  3. FROM Table_A A

  4. INNER JOIN Table_B B

  5. ON A.PK = B.PK;

查询结果:

  1. +------+------+------------+----------+

  2. | A_PK | B_PK | A_Value    | B_Value  |

  3. +------+------+------------+----------+

  4. |    1 |    1 | FOX        | TROT     |

  5. |    2 |    2 | COP        | CAR      |

  6. |    3 |    3 | TAXI       | CAB      |

  7. |    6 |    6 | WASHINGTON | MONUMENT |

  8. |    7 |    7 | DELL       | PC       |

  9. +------+------+------------+----------+

  10. 5 rows in set (0.00 sec)

注:其中 ATable_A 的别名, BTable_B 的别名,下同。

LEFT JOIN

LEFT JOIN 一般被译作左连接,也写作 LEFT OUTER JOIN。左连接查询会返回左表(表 A)中所有记录,不管右表(表 B)中有没有关联的数据。在右表中找到的关联数据列也会被一起返回。

文氏图:

示例查询:

  1. SELECT A.PK AS A_PK, B.PK AS B_PK,

  2.       A.Value AS A_Value, B.Value AS B_Value

  3. FROM Table_A A

  4. LEFT JOIN Table_B B

  5. ON A.PK = B.PK;

查询结果:

  1. +------+------+------------+----------+

  2. | A_PK | B_PK | A_Value    | B_Value  |

  3. +------+------+------------+----------+

  4. |    1 |    1 | FOX        | TROT     |

  5. |    2 |    2 | COP        | CAR      |

  6. |    3 |    3 | TAXI       | CAB      |

  7. |    4 | NULL | LINCION    | NULL     |

  8. |    5 | NULL | ARIZONA    | NULL     |

  9. |    6 |    6 | WASHINGTON | MONUMENT |

  10. |    7 |    7 | DELL       | PC       |

  11. |   10 | NULL | LUCENT     | NULL     |

  12. +------+------+------------+----------+

  13. 8 rows in set (0.00 sec)

RIGHT JOIN

RIGHT JOIN 一般被译作右连接,也写作 RIGHT OUTER JOIN。右连接查询会返回右表(表 B)中所有记录,不管左表(表 A)中有没有关联的数据。在左表中找到的关联数据列也会被一起返回。

文氏图:

示例查询:

  1. SELECT A.PK AS A_PK, B.PK AS B_PK,

  2.       A.Value AS A_Value, B.Value AS B_Value

  3. FROM Table_A A

  4. RIGHT JOIN Table_B B

  5. ON A.PK = B.PK;

查询结果:

  1. +------+------+------------+-----------+

  2. | A_PK | B_PK | A_Value    | B_Value   |

  3. +------+------+------------+-----------+

  4. |    1 |    1 | FOX        | TROT      |

  5. |    2 |    2 | COP        | CAR       |

  6. |    3 |    3 | TAXI       | CAB       |

  7. |    6 |    6 | WASHINGTON | MONUMENT  |

  8. |    7 |    7 | DELL       | PC        |

  9. | NULL |    8 | NULL       | MICROSOFT |

  10. | NULL |    9 | NULL       | APPLE     |

  11. | NULL |   11 | NULL       | SCOTCH    |

  12. +------+------+------------+-----------+

  13. 8 rows in set (0.00 sec)

FULL OUTER JOIN

FULL OUTER JOIN 一般被译作外连接、全连接,实际查询语句中可以写作 FULL OUTER JOINFULL JOIN。外连接查询能返回左右表里的所有记录,其中左右表里能关联起来的记录被连接后返回。

文氏图:

示例查询:

  1. SELECT A.PK AS A_PK, B.PK AS B_PK,

  2.       A.Value AS A_Value, B.Value AS B_Value

  3. FROM Table_A A

  4. FULL OUTER JOIN Table_B B

  5. ON A.PK = B.PK;

查询结果:

  1. ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'FULL OUTER JOIN Table_B B

  2. ON A.PK = B.PK' at line 4

注:我当前示例使用的 MySQL 不支持 FULL OUTER JOIN

应当返回的结果(使用 UNION 模拟):

  1. mysql> SELECT *

  2.    -> FROM Table_A

  3.    -> LEFT JOIN Table_B

  4.    -> ON Table_A.PK = Table_B.PK

  5.    -> UNION ALL

  6.    -> SELECT *

  7.    -> FROM Table_A

  8.    -> RIGHT JOIN Table_B

  9.    -> ON Table_A.PK = Table_B.PK

  10.    -> WHERE Table_A.PK IS NULL;

  11. +------+------------+------+-----------+

  12. | PK   | Value      | PK   | Value     |

  13. +------+------------+------+-----------+

  14. |    1 | FOX        |    1 | TROT      |

  15. |    2 | COP        |    2 | CAR       |

  16. |    3 | TAXI       |    3 | CAB       |

  17. |    4 | LINCION    | NULL | NULL      |

  18. |    5 | ARIZONA    | NULL | NULL      |

  19. |    6 | WASHINGTON |    6 | MONUMENT  |

  20. |    7 | DELL       |    7 | PC        |

  21. |   10 | LUCENT     | NULL | NULL      |

  22. | NULL | NULL       |    8 | MICROSOFT |

  23. | NULL | NULL       |    9 | APPLE     |

  24. | NULL | NULL       |   11 | SCOTCH    |

  25. +------+------------+------+-----------+

  26. 11 rows in set (0.00 sec)

小结

以上四种,就是 SQL 里常见 JOIN 的种类和概念了,看一下它们的合影:

有没有感觉少了些什么,学数学集合时完全不止这几种情况?确实如此,继续看。

延伸用法

LEFT JOIN EXCLUDING INNER JOIN

返回左表有但右表没有关联数据的记录集。

文氏图:

示例查询:

  1. SELECT A.PK AS A_PK, B.PK AS B_PK,

  2.       A.Value AS A_Value, B.Value AS B_Value

  3. FROM Table_A A

  4. LEFT JOIN Table_B B

  5. ON A.PK = B.PK

  6. WHERE B.PK IS NULL;

查询结果:

  1. +------+------+---------+---------+

  2. | A_PK | B_PK | A_Value | B_Value |

  3. +------+------+---------+---------+

  4. |    4 | NULL | LINCION | NULL    |

  5. |    5 | NULL | ARIZONA | NULL    |

  6. |   10 | NULL | LUCENT  | NULL    |

  7. +------+------+---------+---------+

  8. 3 rows in set (0.00 sec)

RIGHT JOIN EXCLUDING INNER JOIN

返回右表有但左表没有关联数据的记录集。

文氏图:

示例查询:

  1. SELECT A.PK AS A_PK, B.PK AS B_PK,

  2.       A.Value AS A_Value, B.Value AS B_Value

  3. FROM Table_A A

  4. RIGHT JOIN Table_B B

  5. ON A.PK = B.PK

  6. WHERE A.PK IS NULL;

查询结果:

  1. +------+------+---------+-----------+

  2. | A_PK | B_PK | A_Value | B_Value   |

  3. +------+------+---------+-----------+

  4. | NULL |    8 | NULL    | MICROSOFT |

  5. | NULL |    9 | NULL    | APPLE     |

  6. | NULL |   11 | NULL    | SCOTCH    |

  7. +------+------+---------+-----------+

  8. 3 rows in set (0.00 sec)

FULL OUTER JOIN EXCLUDING INNER JOIN

返回左表和右表里没有相互关联的记录集。

文氏图:

示例查询:

  1. SELECT A.PK AS A_PK, B.PK AS B_PK,

  2.       A.Value AS A_Value, B.Value AS B_Value

  3. FROM Table_A A

  4. FULL OUTER JOIN Table_B B

  5. ON A.PK = B.PK

  6. WHERE A.PK IS NULL

  7. OR B.PK IS NULL;

因为使用到了 FULL OUTER JOIN,MySQL 在执行该查询时再次报错。

  1. ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'FULL OUTER JOIN Table_B B

  2. ON A.PK = B.PK

  3. WHERE A.PK IS NULL

  4. OR B.PK IS NULL' at line 4

应当返回的结果(用 UNION 模拟):

  1. mysql> SELECT *

  2.    -> FROM Table_A

  3.    -> LEFT JOIN Table_B

  4.    -> ON Table_A.PK = Table_B.PK

  5.    -> WHERE Table_B.PK IS NULL

  6.    -> UNION ALL

  7.    -> SELECT *

  8.    -> FROM Table_A

  9.    -> RIGHT JOIN Table_B

  10.    -> ON Table_A.PK = Table_B.PK

  11.    -> WHERE Table_A.PK IS NULL;

  12. +------+---------+------+-----------+

  13. | PK   | Value   | PK   | Value     |

  14. +------+---------+------+-----------+

  15. |    4 | LINCION | NULL | NULL      |

  16. |    5 | ARIZONA | NULL | NULL      |

  17. |   10 | LUCENT  | NULL | NULL      |

  18. | NULL | NULL    |    8 | MICROSOFT |

  19. | NULL | NULL    |    9 | APPLE     |

  20. | NULL | NULL    |   11 | SCOTCH    |

  21. +------+---------+------+-----------+

  22. 6 rows in set (0.00 sec)

总结

以上七种用法基本上可以覆盖各种 JOIN 查询了。七种用法的全家福:

看着它们,我仿佛回到了当年学数学,求交集并集的时代……

顺带张贴一下 C.L. Moffatt 带 SQL 语句的图片,配合学习,风味更佳:

补充说明

  1. 文中的图使用 Keynote 绘制;

  2. 个人的体会是 SQL 里的 JOIN 查询与数学里的求交集、并集等很像;

  3. SQLite 不支持 RIGHT JOIN 和 FULL OUTER JOIN,可以使用 LEFT JOIN 和 UNION 来达到相同的效果;

  4. MySQL 不支持 FULL OUTER JOIN,可以使用 LEFT JOIN 和 UNION 来达到相同的效果;

  5. 还有更多的 JOIN 用法,比如 CROSS JOIN(迪卡尔集)、SELF JOIN,目前我还未在实际应用中遇到过,且不太好用图来表示,所以并未在本文中进行讲解。如果需要,可以参考 SQL JOINS Slide Presentation 学习。

假如你对我的文章感兴趣,可以关注我的微信公众号 isprogrammer 随时阅读更多内容。

参考

  • Visual Representation of SQL Joins

  • How to do a FULL OUTER JOIN in MySQL?

  • SQL JOINS Slide Presentation