SQL的Join语法有很多,
inner join(等值连接) 只返回两个表中联结字段相等的行,
left join(左联接) 返回包括左表中的所有记录和右表中联结字段相等的记录,
right join(右联接) 返回包括右表中的所有记录和左表中联结字段相等的记录,
看到一篇图解文章,非常清楚简洁的说明了使用JOIN操作后的结果集是什么格式。
假设我们有两张表。Table A 是左边的表。Table B 是右边的表。其各有四条记录,其中有两条记录name是相同的,如下所示:
| A表 |
| id |
name |
| 1 |
Pirate |
| 2 |
Monkey |
| 3 |
Ninja |
| 4 |
Spaghetti |
| B表 |
| id |
name |
| 1 |
Rutabaga |
| 2 |
Pirate |
| 3 |
Darth Vade |
| 4 |
Ninja |
让我们看看不同JOIN的不同。
1.INNER JOIN
SELECT * FROM TableA INNER JOIN TableB ON TableA.name = TableB.name
满足TableA.name = TableB.name的数据共有两条,即 name=Pirate 和 name=Ninja ,结果如下
| 结果集 |
| (TableA.) |
(TableB.) |
| id |
name |
id |
name |
| 1 |
Pirate |
2 |
Pirate |
| 3 |
Ninja |
4 |
Ninja |
Inner join 产生的结果集中,是A和B的交集。
2.FULL [OUTER] JOIN
(1) SELECT * FROM TableA
FULL OUTER JOIN TableB ON TableA.name = TableB.name TableA.name = TableB.name 的情况,A和B的交集有两条数据,那么 FULL OUTER JOIN的结果集, 应该是2+2+2=6条,即上面的交集,再加剩下的四条数据,没有匹配,以null补全。
| 结果集 |
| (TableA.) |
(TableB.) |
| id |
name |
id |
name |
| 1 |
Pirate |
2 |
Pirate |
| 2 |
Monkey |
null |
null |
| 3 |
Ninja |
4 |
Ninja |
| 4 |
Spaghetti |
null |
null |
| null |
null |
1 |
Rutabaga |
| null |
null |
3 |
Darth Vade |
Full outer join 产生A和B的并集。但是需要注意的是,对于没有匹配的记录,则会以null做为值。
可以使用IFNULL判断。 (2) SELECT * FROM TableA
FULL OUTER JOIN TableB ON TableA.name = TableB.name
WHERE TableA.id IS null OR TableB.id IS null 添加这个 where 条件,可以排除掉两表的数据交集。
| 结果集 |
| (TableA.) |
(TableB.) |
| id |
name |
id |
name |
| 2 |
Monkey |
null |
null |
| 4 |
Spaghetti |
null |
null |
| null |
null |
1 |
Rutabaga |
| null |
null |
3 |
Darth Vade |
产生A表和B表没有交集的数据集。
3.LEFT [OUTER] JOIN
(1) SELECT * FROM TableA
LEFT OUTER JOIN TableB ON TableA.name = TableB.name 以左表为准,根据 TableA.name = TableB.name 这个条件,右表没有的数据 null 补全。
| 结果集 |
| (TableA.) |
(TableB.) |
| id |
name |
id |
name |
| 1 |
Pirate |
2 |
Pirate |
| 2 |
Monkey |
null |
null |
| 3 |
Ninja |
4 |
Ninja |
| 4 |
Spaghetti |
null |
null |
Left outer join 产生表A的完全集,而B表中匹配的则有值,没有匹配的则以null值取代。
(2) SELECT * FROM TableA
LEFT OUTER JOIN TableB ON TableA.name = TableB.name
WHERE TableB.id IS null 其实就是在上一步的结果集中又做了一次筛选工作。
| 结果集 |
| (TableA.) |
(TableB.) |
| id |
name |
id |
name |
| 2 |
Monkey |
null |
null |
| 4 |
Spaghetti |
null |
null |
产生在A表中有而在B表中没有的集合。
4.RIGHT [OUTER] JOIN
RIGHT OUTER
JOIN 是后面的表为基础,与LEFT OUTER JOIN用法类似。这里不介绍了。
5.UNION 与 UNION ALL
UNION 操作符用于合并两个或多个 SELECT 语句的结果集。
请注意,UNION 内部的 SELECT 语句必须拥有相同数量的列。列也必须拥有相似的数据类型。同时,每条 SELECT 语句中的列的顺序必须相同。UNION 只选取记录,而UNION ALL会列出所有记录。
(1)SELECT name FROM TableA UNION SELECT name FROM TableB
| 新结果集 |
| name |
| Pirate |
| Monkey |
| Ninja |
| Spaghetti |
| Rutabaga |
| Darth Vade |
选取不同值。
(2)SELECT name FROM TableA UNION ALL SELECT name FROM TableB
| 新结果集 |
| name |
| Pirate |
| Monkey |
| Ninja |
| Spaghetti |
| Rutabaga |
| Pirate |
| Darth Vade |
| Ninja |
全部列出来。
(3)注意:
SELECT * FROM TableA
UNION SELECT * FROM TableB
| 新结果集 |
| id |
name |
| 1 |
Pirate |
| 2 |
Monkey |
| 3 |
Ninja |
| 4 |
Spaghetti |
| 1 |
Rutabaga |
| 2 |
Pirate |
| 3 |
Darth Vade |
| 4 |
Ninja |
由于 id 1 Pirate 与 id 2 Pirate 并不相同,不合并。
6.CROSS JOIN
还需要注意的是“交差集”
cross join,这种Join没有办法用文式图表示, 因为其就是把表A和表B的数据进行一个N*M的组合,即笛卡尔积。 表达式如下:
SELECT * FROM TableA CROSS JOIN TableB
这个笛卡尔乘积会产生 4 x 4 = 16 条记录,一般来说,很少用到这个语法。 但是我们得小心,如果不是使用嵌套的select语句,一般系统都会产生笛卡尔乘积然再做过滤。当表很大的时候,会极大的影响性能。