SQL-JOIN 全解析

434 阅读10分钟

SQL JOIN 的作用就是把来自多个表的数据行,根据一定的规则连接起来,形成一张大的数据表。

例如下面这张用烂了的图,可以帮你快速理解每个 join 用法的效果:

这张图描述了 left join(左连接)、right join(右连接) 、inner join(内连接)、outer join(外连接)相关的 7 种用法。

img

我改了一版:

感觉更方便理解了

img

可以关注我公众号,回复“mysql”,可以拿到高清大图

  • 1、INNER JOIN:如果表中有至少一个匹配,则返回行;
  • 2、LEFT JOIN:即使右表中没有匹配,也从左表返回所有的行;
  • 3、RIGHT JOIN:即使左表中没有匹配,也从右表返回所有的行;
  • 4、FULL JOIN:只要其中一个表中存在匹配,则返回行 。

(一)准备测试数据

测试的数据很简单,依旧拿来在课堂上,书本上用到的老一套的数据表,学生表和成绩表来实现。

1、学生表:

DROP TABLE IF EXISTS `student`;
CREATE TABLE `student`  (
  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT 'id',
  `sno` varchar(20) CHARACTER SET utf8 COLLATE utf8_unicode_ci NULL DEFAULT NULL COMMENT '学号',
  `sname` varchar(10) CHARACTER SET utf8 COLLATE utf8_unicode_ci NULL DEFAULT NULL COMMENT '学生姓名',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE = MyISAM AUTO_INCREMENT = 9 CHARACTER SET = utf8 COLLATE = utf8_unicode_ci ROW_FORMAT = Dynamic;




INSERT INTO `student` VALUES (1, '202001', '张三');
INSERT INTO `student` VALUES (2, '202002', '李四');
INSERT INTO `student` VALUES (3, '202003', '王五');
INSERT INTO `student` VALUES (4, '202004', '赵六');
INSERT INTO `student` VALUES (5, '202005', '小明');
INSERT INTO `student` VALUES (6, '202006', '小红');
INSERT INTO `student` VALUES (7, '202007', '小刚');
INSERT INTO `student` VALUES (8, '202008', '小李');

SET FOREIGN_KEY_CHECKS = 1;

2、成绩表:

DROP TABLE IF EXISTS `grade`;
CREATE TABLE `grade`  (
  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT 'id',
  `sno` varchar(20) CHARACTER SET utf8 COLLATE utf8_unicode_ci NULL DEFAULT NULL COMMENT '学号',
  `courseName` varchar(20) CHARACTER SET utf8 COLLATE utf8_unicode_ci NULL DEFAULT NULL COMMENT '课程名',
  `grade` double(3, 0) NULL DEFAULT NULL COMMENT '成绩',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE = MyISAM AUTO_INCREMENT = 10 CHARACTER SET = utf8 COLLATE = utf8_unicode_ci ROW_FORMAT = Dynamic;




INSERT INTO `grade` VALUES (1, '202001', '高数一', 90);
INSERT INTO `grade` VALUES (2, '202003', '高数二', 88);
INSERT INTO `grade` VALUES (3, '202003', '英语一', 77);
INSERT INTO `grade` VALUES (4, '202004', '英语二', 79);
INSERT INTO `grade` VALUES (5, '202002', 'C++语言设计', 87);
INSERT INTO `grade` VALUES (6, '202005', 'Java面向对象基础', 98);
INSERT INTO `grade` VALUES (7, '202006', '算法分析与实现', 76);
INSERT INTO `grade` VALUES (8, '202007', '软件工程A', 65);
INSERT INTO `grade` VALUES (9, '202007', '计算机应用与基础', 59);

SET FOREIGN_KEY_CHECKS = 1;

现在的数据如下:

mysql> select * from grade;
+
| id | sno    | courseName       | grade |
+
|  1 | 202001 | 高数一           |    90 |
|  2 | 202003 | 高数二           |    88 |
|  3 | 202003 | 英语一           |    77 |
|  4 | 202004 | 英语二           |    79 |
|  5 | 202002 | C++语言设计      |    87 |
|  6 | 202005 | Java面向对象基础 |    98 |
|  7 | 202006 | 算法分析与实现   |    76 |
|  8 | 202007 | 软件工程A        |    65 |
|  9 | 202007 | 计算机应用与基础 |    59 |
+
9 rows in set (0.12 sec)

mysql> 
mysql> select * from student;
+
| id | sno    | sname |
+
|  1 | 202001 | 张三  |
|  2 | 202002 | 李四  |
|  3 | 202003 | 王五  |
|  4 | 202004 | 赵六  |
|  5 | 202005 | 小明  |
|  6 | 202006 | 小红  |
|  7 | 202007 | 小刚  |
|  8 | 202008 | 小李  |
+
8 rows in set (0.12 sec)

mysql> 

数据结构如下:

mysql> 
mysql> desc grade;
+
| Field      | Type        | Null | Key | Default | Extra          |
+
| id         | int(11)     | NO   | PRI | NULL    | auto_increment |
| sno        | varchar(20) | YES  |     | NULL    |                |
| courseName | varchar(20) | YES  |     | NULL    |                |
| grade      | double(3,0) | YES  |     | NULL    |                |
+
4 rows in set (0.09 sec)

mysql> 
mysql> desc student;
+
| Field | Type        | Null | Key | Default | Extra          |
+
| id    | int(11)     | NO   | PRI | NULL    | auto_increment |
| sno   | varchar(20) | YES  |     | NULL    |                |
| sname | varchar(10) | YES  |     | NULL    |                |
+
3 rows in set (0.10 sec)

mysql> 

(二)左连接

在 7 种 join 的用法中,左连接的用法有两种,如下图所示:

img

第一种:

mysql> select * from student t1 
    -> left join grade t2 
    -> on t1.sno=t2.sno;
+
| id | sno    | sname | id   | sno    | courseName       | grade |
+
|  1 | 202001 | 张三  |    1 | 202001 | 高数一           |    90 |
|  3 | 202003 | 王五  |    2 | 202003 | 高数二           |    88 |
|  3 | 202003 | 王五  |    3 | 202003 | 英语一           |    77 |
|  4 | 202004 | 赵六  |    4 | 202004 | 英语二           |    79 |
|  2 | 202002 | 李四  |    5 | 202002 | C++语言设计      |    87 |
|  5 | 202005 | 小明  |    6 | 202005 | Java面向对象基础 |    98 |
|  6 | 202006 | 小红  |    7 | 202006 | 算法分析与实现   |    76 |
|  7 | 202007 | 小刚  |    8 | 202007 | 软件工程A        |    65 |
|  7 | 202007 | 小刚  |    9 | 202007 | 计算机应用与基础 |    59 |
|  8 | 202008 | 小李  | NULL | NULL   | NULL             | NULL  |
+
10 rows in set (0.10 sec)

mysql> 

从上面结果中可以看到我们学生中有小李,但是成绩表中并没有小李的成绩。所以会出现 null 的情况。

这也验证了我们前面所述的一句话: LEFT JOIN即使右表中没有匹配,也从左表返回所有的行

即使成绩表中没有匹配的数据,也从左表返回所有的行

那么在大多数情况下,我们是不让显示 null 的数据的,那该怎么办? 很简单,可以调换一下 t1 和 t2 的位置即可,如下实验效果:

mysql> 
mysql> select * from grade t1 
    -> left join student t2 
    -> on t1.sno=t2.sno;
+
| id | sno    | courseName       | grade | id | sno    | sname |
+
|  1 | 202001 | 高数一           |    90 |  1 | 202001 | 张三  |
|  5 | 202002 | C++语言设计      |    87 |  2 | 202002 | 李四  |
|  2 | 202003 | 高数二           |    88 |  3 | 202003 | 王五  |
|  3 | 202003 | 英语一           |    77 |  3 | 202003 | 王五  |
|  4 | 202004 | 英语二           |    79 |  4 | 202004 | 赵六  |
|  6 | 202005 | Java面向对象基础 |    98 |  5 | 202005 | 小明  |
|  7 | 202006 | 算法分析与实现   |    76 |  6 | 202006 | 小红  |
|  8 | 202007 | 软件工程A        |    65 |  7 | 202007 | 小刚  |
|  9 | 202007 | 计算机应用与基础 |    59 |  7 | 202007 | 小刚  |
+
9 rows in set (0.16 sec)

mysql> 

此处是重点:在Mysql5.7的官方手册中也提及到,这个优化的方式:

At the parser stage, queries with right outer join operations are converted to equivalent queries containing only left join operations. In the general case, the conversion is performed such that this right join:

在解析器阶段,具有右外部连接的查询会被转换为仅包含左连接操作的相等查询。 在一般情况下,左连接会转换成右连接

(T1, ...) RIGHT JOIN (T2, ...) ON P(T1, ..., T2, ...)

Becomes this equivalent left join: 变成下面这个等价的左连接:

(T2, ...) LEFT JOIN (T1, ...) ON P(T1, ..., T2, ...)

可以看到在转换的时候,会把 t1 变成 t2,把 t2 的位置换成 t1 的位置。

第二种:

mysql> 
mysql> select * from student t1 
    -> left join grade t2 
    -> on t1.sno=t2.sno
    -> where t2.sno is null;
+
| id | sno    | sname | id   | sno  | courseName | grade |
+
|  8 | 202008 | 小李  | NULL | NULL | NULL       | NULL  |
+
1 row in set (19.59 sec)

mysql> 

从结果上看,很清楚,只查出来了 sno 为 null 的数据。 如果 not null 呢?

mysql> 
mysql> select * from student t1 
    left join grade t2 
    on t1.sno=t2.sno
    where t2.sno is NOT null;
+
| id | sno    | sname | id | sno    | courseName       | grade |
+
|  1 | 202001 | 张三  |  1 | 202001 | 高数一           |    90 |
|  3 | 202003 | 王五  |  2 | 202003 | 高数二           |    88 |
|  3 | 202003 | 王五  |  3 | 202003 | 英语一           |    77 |
|  4 | 202004 | 赵六  |  4 | 202004 | 英语二           |    79 |
|  2 | 202002 | 李四  |  5 | 202002 | C++语言设计      |    87 |
|  5 | 202005 | 小明  |  6 | 202005 | Java面向对象基础 |    98 |
|  6 | 202006 | 小红  |  7 | 202006 | 算法分析与实现   |    76 |
|  7 | 202007 | 小刚  |  8 | 202007 | 软件工程A        |    65 |
|  7 | 202007 | 小刚  |  9 | 202007 | 计算机应用与基础 |    59 |
+
9 rows in set (19.46 sec)

mysql> 

这就很神奇了,居然和我们上一种想要的最终结果一样。那么这个 sql 就是舍弃掉了为 null 的数据。

(三)右连接

img

这个的用法和左连接正好相反,可以在脑子中想想一下。

不罗嗦了,直接看效果吧。

mysql> 
mysql> select * from student t1 
    right join grade t2 
    on t1.sno=t2.sno;
+
| id | sno    | sname | id | sno    | courseName       | grade |
+
|  1 | 202001 | 张三  |  1 | 202001 | 高数一           |    90 |
|  2 | 202002 | 李四  |  5 | 202002 | C++语言设计      |    87 |
|  3 | 202003 | 王五  |  2 | 202003 | 高数二           |    88 |
|  3 | 202003 | 王五  |  3 | 202003 | 英语一           |    77 |
|  4 | 202004 | 赵六  |  4 | 202004 | 英语二           |    79 |
|  5 | 202005 | 小明  |  6 | 202005 | Java面向对象基础 |    98 |
|  6 | 202006 | 小红  |  7 | 202006 | 算法分析与实现   |    76 |
|  7 | 202007 | 小刚  |  8 | 202007 | 软件工程A        |    65 |
|  7 | 202007 | 小刚  |  9 | 202007 | 计算机应用与基础 |    59 |
+
9 rows in set (19.49 sec)

mysql> 

从上面效果上可以看到只匹配到了成绩表中有的数据,小李就没有显示。 也验证了: RIGHT JOIN即使左表中没有匹配,也从右表返回所有的行

(四)内连接

img

INNER JOIN:如果表中有至少一个匹配,则返回行;

mysql> select * from student t1 
    inner join grade t2 
    on t1.sno=t2.sno;
+
| id | sno    | sname | id | sno    | courseName       | grade |
+
|  1 | 202001 | 张三  |  1 | 202001 | 高数一           |    90 |
|  3 | 202003 | 王五  |  2 | 202003 | 高数二           |    88 |
|  3 | 202003 | 王五  |  3 | 202003 | 英语一           |    77 |
|  4 | 202004 | 赵六  |  4 | 202004 | 英语二           |    79 |
|  2 | 202002 | 李四  |  5 | 202002 | C++语言设计      |    87 |
|  5 | 202005 | 小明  |  6 | 202005 | Java面向对象基础 |    98 |
|  6 | 202006 | 小红  |  7 | 202006 | 算法分析与实现   |    76 |
|  7 | 202007 | 小刚  |  8 | 202007 | 软件工程A        |    65 |
|  7 | 202007 | 小刚  |  9 | 202007 | 计算机应用与基础 |    59 |
+
9 rows in set (0.12 sec)

mysql> 

(五)外连接

这一种在 Mysql 中是不支持的,可以在 SQL Server 上测试。这里就不测试了。

  • 1、INNER JOIN:如果表中有至少一个匹配,则返回行;
  • 2、LEFT JOIN:即使右表中没有匹配,也从左表返回所有的行;
  • 3、RIGHT JOIN:即使左表中没有匹配,也从右表返回所有的行;
  • 4、FULL JOIN:只要其中一个表中存在匹配,则返回行 。

欢迎一起学习,一起交流,一起进步。

关注我微信公众号第一时间推送给你精彩内容哦