这是我参与「 第五届青训营 」伴学笔记创作活动的第 16 天 官方介绍索引是帮助MySQL高效获取数据的数据结构。简单来讲,数据库索引就像是书前面的目录,能加快数据库的查询速度
简介
- 索引(Index)是帮助MySQL高效获取数据的数据结构。可以得到索引的本质:索引是数据结构。
- 如果没有特殊指明,那么索引默认为B树。而聚集索引、复合索引、前缀索引、唯一索引默认为B+树。
- 在数组中索引的表现形式为数组下标。
- 通过建立索引可以提高mysql在查询排序等操作时的性能。
- 索引本质也是一张表,存储于磁盘空间,所以索引会影响表的更新相关操作
分类
- 单值索引:索引占单独一个列,一个表可以有多个单值索引
- 唯一索引:索引列值必须唯一,但允许有空值
- 复合索引:索引占多个列
操作
- 创建
create [unique] index index_name on table_name(col_name(length)) alter table_name add [unique] index [index_name] on col_name(length)
- 删除
drop index index_name on table_name
- 查看
show index from table_name
结构
- B-Tree
- Hash
- full-text
- R-Tree
建立索引的选择
- 主键自动建立唯一索引频繁
- 作为查询条件的字段应该创建索引
- 查询中与其它表关联的字段,外键关系建立索引
- 频繁更新的字段不适合创建索引。因为每次更新不单单是更新了记录还会更新索引
- Where条件里用不到的字段不创建索引
- 单键/组合索引的选择问题,who? (在高并发下倾向创建组合索引)
- 查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度
- 查询中统计或者分组字段
性能分析
-
mysql query optimizer:mysql内部优化模块
-
常见瓶颈:
- cpu
- 磁盘IO
- 硬件:top、free、iostat、vmstat查看性能状态
explain
作用介绍
- 表的读取顺序
- 数据读取操作的操作类型
- 哪些索引可以使用
- 哪些索引被实际使用
- 表之间的引用
- 每张表有多少行被优化器查询
功能详解
-
id:select查询的序列号,包含一组数字,表示查询的select语句或操作表的顺序。
- id相同时,执行顺序由上至下
- id全不同时,如果是子查询,id值越大优先级越高
- id不全相同时,先执行id值大的,后顺序执行
-
select_type:查询的类型
- simple:普通查询
- primary:子查询最外层的查询
- subquery:在select或where中包含子查询
- derived:在from中包含子查询,结果保存为临时表
- union:若第二个select出现在union之后,则被标记为union;若union包含在from子句的子查询中,外层select将被标记为: derived
- union result:union的结果
-
table:本次查询所使用的表
-
type:查询的类型 ALL、index、range、ref、eq_ ref、const, system、all。其中system> const>eq ref> ref> range> index> all
- system:只有一行记录const类型的特例
- const:表示通过索引一次就找到了,const用于比较primary key或者unique索引。
- eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描
- ref:非唯一性索引扫描,返回匹配某个单独值的所有行,用到索引查出多条记录。
- range:只检索给定范围的行,使用一个索引来选择行。key 列显示使用了哪个索引。一般就是在你的where语句中出现了between、<、>、in等的查询,不用扫描全部索引。
- index:与ALL区别为index类型只遍历索引树。这通常比all快,因为索引文件通常比数据文件小。也就是说虽然all和Index都是读全表,但index是 从索引中读取的,而all是 从硬盘中读的)
- all:从磁盘空间读并遍历全表
-
possible_ keys:显示可能应用在这张表中的索引,一个或多个,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用
-
key:实际使用的索引,如果为null则表示没有使用索引。查询中若使用了覆盖索引,则该索引仅出现在key列表中
-
key_len:表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好key_ len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_ len是 根据表定义计算而得,不是通过表内检索出的
-
ref:显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值
-
rows:根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数
-
extra:额外属性
- using filesort:说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为"文件排序”
- using temporary:使了用临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询group by未能根据已有索引进行查找
- using index:表示相应的select操作中使用了覆盖索引(Covering Index), 避免访问了表的数据行,效率不错! 如果同时出现usingwhere,表明索引被用来执行索引键值的查找; 如果没有同时出现usingwhere,表明索引用来读取数据而非执行查找动作。
- using where:使用了where过滤
- using join buffer:使用了链接缓存
- impossible where:查询失败
- select tables optimized:在没有GROUPBY子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。
- distinct:优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作
索引优化
- 全值匹配,对索引中所有列都指定具体值
- 最佳左前缀法则,如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。
- 不在索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描
- 存储引擎不能使用索引中范围条件右边的列
- 尽量使用覆盖索引(只访问索引的查询(索引列和查询列一致)),减少select*
- mysql在使用不等于(!=或者<>)的时候无法使用索引会导致全表扫描
- is null ,is not null也无法使用索引
- like以通配符开头('%abc...') mysq|索引失效会变成全表扫描的操作,双%可使用覆盖索引查询
- 字符串不加单引号索引失效
- 少用or,用它来连接时会索引失效