MySQL--索引优化原则(5)

113 阅读5分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第36天,点击查看活动详情

数据准备

上面我们学习到了使用explain命令帮助我们分析索引的执行情况,接下来我们继续深入谈谈索引优化的一些原则和具体场景的优化方式。

  • 创建数据库、表,插入数据

    create database idx_optimize character set 'utf8';
    ​
    CREATE TABLE users(
      id INT PRIMARY KEY AUTO_INCREMENT,
      user_name VARCHAR(20) NOT NULL COMMENT '姓名',
      user_age INT NOT NULL DEFAULT 0 COMMENT '年龄',
      user_level VARCHAR(20) NOT NULL COMMENT '用户等级',
      reg_time TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '注册时间'
    );
    ​
    INSERT INTO users(user_name,user_age,user_level,reg_time)
    VALUES('tom',17,'A',NOW()),('jack',18,'B',NOW()),('lucy',18,'C',NOW());
    
  • 创建联合索引

    ALTER TABLE users ADD INDEX idx_nal (user_name,user_age,user_level) USING BTREE;
    

2.优化原则详解

1)最佳左前缀法则

最佳左前缀法则: 如果创建的是联合索引,就要遵循该法则. 使用索引时,where后面的条件需要从索引的最左前列开始使用,并且不能跳过索引中的列使用。

  • 场景1: 按照索引字段顺序使用,三个字段都使用了索引,没有问题。
EXPLAIN SELECT * FROM users WHERE user_name = 'tom' 
AND user_age = 17 AND user_level = 'A';

image.png

  • 场景2: 直接跳过user_name使用索引字段,索引无效,未使用到索引。
EXPLAIN SELECT * FROM users WHERE user_age = 17 AND user_level = 'A';

image.png

  • 场景3: 不按照创建联合索引的顺序,使用索引
EXPLAIN SELECT * FROM users WHERE 
user_age = 17 AND user_name = 'tom' AND user_level = 'A';

image.png

where后面查询条件顺序是 user_ageuser_leveluser_name与我们创建的索引顺序user_nameuser_ageuser_level不一致,为什么还是使用了索引,原因是因为MySql底层优化器对其进行了优化。

  • 最佳左前缀底层原理

MySQL创建联合索引的规则是: 首先会对联合索引最左边的字段进行排序 ( 例子中是 user_name ), 在第一个字段的基础之上 再对第二个字段进行排序 ( 例子中是 user_age ) .

所以: 最佳左前缀原则其实是和B+树的结构有关系, 最左字段肯定是有序的, 第二个字段则是无序的(联合索引的排序方式是: 先按照第一个字段进行排序,如果第一个字段相等再根据第二个字段排序). 所以如果直接使用第二个字段 user_age 通常是使用不到索引的.

image.png

2) 不要在索引列上做任何计算

不要在索引列上做任何操作,比如计算、使用函数、自动或手动进行类型转换,会导致索引失效,从而使查询转向全表扫描。

  • 插入数据

    INSERT INTO users(user_name,user_age,user_level,reg_time) VALUES('11223344',22,'D',NOW());
    
  • 场景1: 使用系统函数 left()函数,对user_name进行操作

    EXPLAIN SELECT * FROM users WHERE LEFT(user_name, 6) = '112233';
    

image.png

  • 场景2: 字符串不加单引号 (隐式类型转换)

    varchar类型的字段,在查询的时候不加单引号,就需要进行隐式转换, 导致索引失效,转向全表扫描。

    EXPLAIN SELECT * FROM users WHERE user_name = 11223344;
    

image.png

3) 范围之后全失效

在编写查询语句时, where条件中如果有范围条件, 并且范围条件之后还有其他过滤条件, 那么范围条件之后的列就都将会索引失效.

  • 场景1: 条件单独使用user_name时, type=ref, key_len=62

    -- 条件只有一个 user_name
    EXPLAIN SELECT * FROM users WHERE user_name = 'tom';
    

image.png

  • 场景2: 条件增加一个 user_age ( 使用常量等值) ,type= ref , key_len = 66

    EXPLAIN SELECT * FROM users WHERE user_name = 'tom' AND user_age = 17;
    

image.png

  • 场景3: 使用全值匹配, type = ref , key_len = 128 , 索引都利用上了.

    EXPLAIN SELECT * FROM users WHERE user_name = 'tom' 
    AND user_age = 17 AND user_level = 'A';
    

image.png

  • 场景4: 使用范围条件时, avg > 17 , type = range , key_len = 66 , 与场景3 比较,可以发现 user_level 索引没有用上.

    EXPLAIN SELECT * FROM users WHERE user_name = 'tom' 
    AND user_age > 17 AND user_level = 'A';
    

image.png

image.png

4) 避免使用 is null 、 is not null、!= 、or

  • 使用 is null 会使索引失效

    EXPLAIN SELECT * FROM users WHERE user_name IS NULL;
    

image.png

 Impossible Where: 表示where条件不成立, 不能返回任何行
  • 使用 is not null 会使索引失效

    EXPLAIN SELECT * FROM users WHERE user_name IS NOT NULL;
    

image.png

  • 使用 !=or 会使索引失效

    EXPLAIN SELECT * FROM users WHERE user_name != 'tom';
    ​
    EXPLAIN SELECT * FROM users WHERE user_name = 'tom' or user_name = 'jack';
    

image.png

5) like以%开头会使索引失效

like查询为范围查询,%出现在左边,则索引失效。%出现在右边索引未失效.

  • 场景1: 两边都有% 或者 字段右边有%,索引都会失效

    EXPLAIN SELECT * FROM users WHERE user_name LIKE '%tom%';
    ​
    EXPLAIN SELECT * FROM users WHERE user_name LIKE '%tom';
    

image.png

  • 场景2: 字段左边有%,索引生效

    EXPLAIN SELECT * FROM users WHERE user_name LIKE 'tom%';
    

image.png

解决%出现在左边索引失效的方法

  • 使用覆盖索引

    EXPLAIN SELECT user_name FROM users WHERE user_name LIKE '%jack%';
    ​
    EXPLAIN SELECT user_name,user_age,user_level FROM users WHERE user_name LIKE '%jack%';
    

image.png

对比场景1可以知道, 通过使用覆盖索引 `type = index`,并且 `extra = Using index`,从全表扫描变成了全索引扫描.
  • like 失效的原理

    1. %号在右: 由于B+树的索引顺序,是按照首字母的大小进行排序,%号在右的匹配又是匹配首字母。所以可以在B+树上进行有序的查找,查找首字母符合要求的数据。所以有些时候可以用到索引.
    2. %号在左: 是匹配字符串尾部的数据,我们上面说了排序规则,尾部的字母是没有顺序的,所以不能按照索引顺序查询,就用不到索引.
    3. 两个%%号: 这个是查询任意位置的字母满足条件即可,只有首字母是进行索引排序的,其他位置的字母都是相对无序的,所以查找任意位置的字母是用不上索引的.

索引优化原则总结

  • 最左前缀法则要遵守
  • 索引列上不计算
  • 范围之后全失效
  • 覆盖索引记住用。
  • 不等于、is null、is not null、or导致索引失效。
  • like百分号加右边,加左边导致索引失效,解决方法:使用覆盖索引。