LEFT JOIN ON后面的条件和WHERE后面的条件区别

1,353 阅读3分钟

优先级

两者放置相同条件,之所以可能会导致结果集不同,就是因为优先级on的优先级是高于where的。

首先明确两个概念:

  • LEFT JOIN 关键字会从左表 (table_name1) 那里返回所有的行,即使在右表 (table_name2) 中没有匹配的行。
  • 数据库在通过连接两张或多张表来返回记录时,都会生成一张中间的临时表,然后再将这张临时表返回给用户。

LEFT JOIN下,两者的区别:

  • on是在生成临时表的时候使用的条件,不管on的条件是否起到作用,都会返回左表 (table_name1) 的行。
  • where则是在生成临时表之后使用的条件,此时已经不管是否使用了LEFT JOIN了,只要条件不为真的行,全部过滤掉。

测试

表1:table1

id    major_category_id
1A
2B
3C

表2:table2

idmajor_name
A游戏建模
B影视设计
C电商运营
//注意看以下SQL的区别
select a.id,a.major_category_id,b.major_name from table1 a left join table2 b on (a.major_category_id = b.id and b.major_name='游戏建模');
select a.id,a.major_category_id,b.major_name from table1 a left join table2 b on (a.major_category_id = b.id) where b.major_name='游戏建模';

第一个结果集:

|id |major_category_id |major_name|
|---|---|---|
|1  |A |游戏建模|
|2  |B |(Null)|
|3  |C |(Null)|    

第二个结果集:

|id |major_category_id |major_name|
|---|---|---|
|1  |A |游戏建模|

第一个sql的执行流程:首先找到table2表的major_name为游戏建模的记录行(on (a.major_category_id = b.id and b.major_name='游戏建模'))。然后找到a的数据(即使不符合b表的规则),生成临时表返回用户。

  第二个sql的执行流程:首先生成临时表,然后执行where过滤 b.major_name='游戏建模' 不为真的结果集,最后返回给用户。

因为on会首先过滤掉不符合条件的行,然后才会进行其它运算,所以按理说on是最快的。

在多表查询时,onwhere更早起作用。系统首先根据各个表之间的联接条件,把多个表合成一个临时表后,再由where进行过滤,然后再计算,计算完后再由having进行过滤。由此可见,要想过滤条件起到正确的作用,首先要明白这个条件应该在什么时候起作用,然后再决定放在那里。

对于JOIN参与的表的关联操作,如果需要不满足连接条件的行也在我们的查询范围内的话,我们就必需把连接条件放在ON后面,而不能放在WHERE后面(比如左表的数据范围比连接表的范围大,连接条件放在on后面,不满足连接表的会以null形式显示,如果放在where后面,就会把这些数据过滤掉)。

如果我们把连接条件放在了WHERE后面,那么所有的LEFT,RIGHT,等这些操作将不起任何作用,对于这种情况,它的效果就完全等同于INNER连接。对于那些不影响选择行的条件,放在ON或者WHERE后面就可以。

总而言之

  1. 所有的连接条件都必需要放在ON后面,不然前面的所有LEFTRIGHT关联将作为摆设,而不起任何作用。
  2. 像在开发过程中遇到需要根据逻辑删除 deleted 条件过滤,比如 A left join B ON A.xxx = B.xxx 当希望返回A表数据,B表当 deleted=0(0否1是)的时候,期待返回 A 表数据以及 B 表为空的数据,b.deleted 条件就不能放到where后面,需要放到on后面。