选择索引是优化器的工作
而优化器选择索引的目的,是找到一个最优的执行方案,并用最小的代价去执行语句。在数据库里面,扫描行数是影响执行代价的因素之一。扫描的行数越少,意味着访问磁盘数据的次数越少,消耗的 CPU 资源越少。
当然,扫描行数并不是唯一的判断标准,优化器还会结合是否使用临时表、是否排序等因素进行综合判断。
MySQL 在真正开始执行语句之前,并不能精确地知道满足这个条件的记录有多少条,而只能根据统计信息来估算记录数
这个统计信息就是索引的“区分度”。显然,一个索引上不同的值越多,这个索引的区分度就越好。而一个索引上不同的值的个数,我们称之为“基数”(cardinality)。也就是说,这个基数越大,索引的区分度越好。
我们可以使用 show index 方法,看到一个索引的基数
analyze table t 命令,可以用来重新统计索引信息
采用 force index 强行选择一个索引
没有使用索引反而去全表扫描的可能原因:
使用索引的时候,每次从索引上拿到一个值,都要回到主键索引上查出整行数据,这个代价优化器也要算进去的,全表扫描的时候没有回表的操作,优化器会估算这两个选择的代价,当优化器认为直接扫描主键索引更快的时候就不会走索引了。