两类非常隐蔽的全表扫描,不能命中索引(一分钟系列)

1,036 阅读3分钟

昨天的文章《MySQL 死锁分析的两个工具》中,举了一个强制类型转换导致死锁的例子,有朋友询问是不是类型转换都不能命中索引,花 1 分钟细说一下。

第一类“列类型”与 “where 值类型” 不符,不能命中索引,会导致全表扫描 (full table scan)。

数据准备

create table t1 (
cell varchar(3) primary key
)engine=innodb default charset=utf8;

insert into t1(cell) values ('111'),('222'),('333');

(1)cell 属性为 varchar 类型;

(2)cell 为主键,即聚簇索引 (clustered index);

(3)t1 插入 3 条测试数据;

测试语句

explain select * from t1 where cell=111;
explain select * from t1 where cell='111';

(1)第一个语句,where 后的值类型是整数(与表 cell 类型不符);

(2)第二个语句,where 后的值类型是字符串(与表 cell 类型一致);

测试结果

(1)强制类型转换,不能命中索引,需要全表扫描,即 3 条记录;

(2)类型相同,命中索引,1 条记录;

画外音:关于 explain_,详见《MySQL 死锁分析的两个工具》__。_

第二类相 join 的两个表的字符编码不同,不能命中索引,会导致笛卡尔积的循环计算(nested loop)。

数据准备

create table t2 (
cell varchar(3) primary key
)engine=innodb default charset=latin1;

_insert into t2(cell) values ('111'),('222'),('333'),('444'),('555'),('666');
_

create table t3 (
cell varchar(3) primary key
)engine=innodb default charset=utf8;

insert into t3(cell) values ('111'),('222'),('333'),('444'),('555'),('666');

(1)t2 和 t1 字符集不同,插入 6 条测试数据;

(2)t3 和 t1 字符集相同,也插入 6 条测试数据;

(3)除此之外,t1,t2,t3 表结构完全相同;

测试语句

explain select * from t1,t2 where t1.cell=t2.cell;
explain select * from t1,t3 where t1.cell=t3.cell;

(1)第一个 join,连表 t1 和 t2(字符集不同),关联属性是 cell;

(2)第一个 join,连表 t1 和 t3(字符集相同),关联属性是 cell;

测试结果

(1)t1 和 t2 字符集不同,存储空间不同;

(2)t1 和 t2 相 join 时,遍历了 t1 的所有记录 3 条,t1 的每一条记录又要遍历 t2 的所有记录 6 条,实际进行了笛卡尔积循环计算 (nested loop),索引无效;

(3)t1 和 t3 相 join 时,遍历了 t1 的所有记录 3 条,t1 的每一条记录使用 t3 索引,即扫描 1 行记录;

画外音:图片请放大。

总结

两类隐蔽的不能利用索引的 case:

(1)表列类型,与 where 值类型,不一致;

(2)join 表的字符编码不同;

画外音:本文测试于 MySQL5.6。

作业

create table t1 (
cell varchar(3) primary key
)engine=innodb default charset=utf8;

insert into t1(cell) values ('111'),('222'),('333');

create table t2 (
cell char(3) primary key
)engine=innodb default charset=utf8;

_insert into t2(cell) values ('111'),('222'),('333'),('444'),('555'),('666');
_

create table t3 (
cell int primary key
)engine=innodb default charset=utf8;

insert into t3(cell) values (111),(222),(333),(444),(555),(666);

(1)t1, t2, t3 的 cell 类型不同:分别是 varchar(3), char(3), int;

(2)编码类型相同,均为 utf8;

请问:t1 与 t2,t1 与 t3 的 join 查询,能命中索引吗

explain select * from t1,t2 where t1.cell=t2.cell;
explain select * from t1,t3 where t1.cell=t3.cell;

动动手,“实际结果” 与 “你以为的”,未必相同。

希望这 1 分钟大家有收获,有思考,求帮转