什么是索引?
通俗来说,书的目录就是索引。那么在数据库,索引就是数据的目录。
不同的数据库有不同的存储引擎,同一个数据库也有不同的存储引擎,那么接下来所讲的索引以及数据存储等的方式实现都是基于MySQL的InnoDB引擎,这也是 MySQL 5.5 之后默认的存储引擎。
索引的分类
从数据结构的角度来看:
MySQL 常见索引有 B+Tree索引、Hash索引、Full-Text索引。
下面主要介绍B+Tree索引。
InnoDB 是在 MySQL 5.5 之后成为默认的 MySQL 存储引擎,B+Tree 索引类型也是 MySQL 存储引擎使用最多的索引类型。
在创建表时,InnoDB 存储引擎会根据不同的场景选择不同的列作为索引。
- 使用主键
- 若无主键,使用第一个非空的值的唯一列
- 默认生成隐式uid
其它索引都属于辅助索引(Secondary Index),也被称为二级索引或非聚簇索引。当然,主键索引与二级索引默认都是使用的B+Tree索引。
编辑
B+Tree 存储千万级的数据只需要 3-4 层高度就可以满足,这意味着从千万级的表查询目标数据最多需要 3-4 次磁盘 I/O,所以B+Tree 相比于 B 树和二叉树来说,最大的优势在于查询效率很高,因为即使在数据量很大的情况,查询一个数据的磁盘 I/O 依然维持在 3-4次。
那么为什么MySQL不选择hash索引作为默认索引?
虽然hash索引的搜索复杂度为O(1),但是hash索引不适合做范围上的查询,索引B+Tree索引拥有更广泛的使用场景。
从物理存储的角度来看:
索引分为聚簇索引(主键索引)、二级索引(辅助索引)。
1. 主键索引的 B+Tree 的叶子节点存放的是实际数据,所有完整的用户记录都存放在主键索引的 B+Tree 的叶子节点里
2. 二级索引的 B+Tree 的叶子节点存放的是主键值,而不是实际数据
按字段的特性来看:
索引分为主键索引、唯一索引、普通索引、前缀索引。
注意:
1. 主键索引就是建立在主键字段上的索引,通常在创建表的时候一起创建,一张表最多只有一个主键索引,索引列的值不允许有空值。
2. 唯一索引建立在 UNIQUE 字段上的索引,一张表可以有多个唯一索引,索引列的值必须唯一,但是允许有空值。
- 普通索引就是建立在普通字段上的索引,既不要求字段为主键,也不要求字段为 UNIQUE
4. 前缀索引是指对字符类型字段的前几个字符建立的索引,而不是在整个字段上建立的索引,前缀索引可以建立在字段类型为 char、 varchar、binary、varbinary 的列上。
使用前缀索引的目的是为了减少索引占用的存储空间,提升查询效率。
按字段个数来看:
从字段个数的角度来看,索引分为单列索引、联合索引(复合索引)
什么是联合索引?
通过将多个字段组合成一个索引,该索引就被称为联合索引
最左匹配原则?
使用联合索引时,存在最左匹配原则,也就是按照最左优先的方式进行索引的匹配。在使用联合索引进行查询的时候,如果不遵循「最左匹配原则」,联合索引会失效,这样就无法利用到索引快速查询的特性了。
比如,如果创建了一个 (a, b, c) 联合索引,如果查询条件是以下这几种,就可以匹配上联合索引:
- where a=1;
- where a=1 and b=2 and c=3;
- where a=1 and b=2;
需要注意的是,因为有查询优化器,所以 a 字段在 where 子句的顺序并不重要。
但是,如果查询条件是以下这几种,因为不符合最左匹配原则,所以就无法匹配上联合索引,联合索引就会失效:
- where b=2;
- where c=3;
- where b=2 and c=3;
思考?
假设以下的语句的联合索引为(a,b) (name,age)
select * from t_table where a > 1 and b = 2,联合索引(a, b)哪一个字段用到了联合索引的 B+Tree?
select * from t_table where a >= 1 and b = 2,联合索引(a, b)哪一个字段用到了联合索引的 B+Tree?
SELECT * FROM t_table WHERE a BETWEEN 2 AND 8 AND b = 2,联合索引(a, b)哪一个字段用到了联合索引的 B+Tree?
SELECT * FROM t_user WHERE name like 'j%' and age = 22,联合索引(name, age)哪一个字段用到了联合索引的 B+Tree?
最后,索引失效的场景,你能想到吗?
1. 对索引使用左或者左右模糊匹配
select * from t_user where name like '%林';
select * from t_user where name like '林%';
2. 对索引使用函数
3. 对索引进行表达式计算
explain select * from t_user where id + 1 = 10;
4. 对索引隐式类型转换
5. 联合索引非最左匹配
6. WHERE 子句中的 OR