MySQL数据库——索引

1,838 阅读9分钟

索引的概念

  • 索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于c语言的链表通过指针指向数据记录的内存地址)。
  • 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。
  • 索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
  • 索引是表中一列或者若干列值排序的方法。
  • 建立索引的目的是加快对表中记录的查找或排序

索引的作用

  • 设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。
  • 当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。
  • 可以降低数据库的IO成本,并且索引还可以降低数据库的排序成本。
  • 通过创建唯一性索引,可以保证数据表中每一行数据的唯一性。
  • 可以加快表与表之间的连接
  • 在使用分组和排序时,可大大减少分组和排序的时间。
  • 建立索引在搜索和恢复数据库中的数据时能显著提高性能

索引的副作用

  • 索引需要占用额外的磁盘空间
    • 对于MyISAM引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址。
    • InnoDB 引擎的表数据文件本身就是索引文件,即索引文件和数据文件是同一个。
  • 更新一个包含索引的表需要比更新一个没有索引的表花费更多的时间,这是由于索引本身也需要更新。因此,理想的做法是仅仅在常常被搜索的列(以及表)上面创建索引。

索引的排序功能

  1. 先创建一个表,在表内随机插入记录(如:id不按顺序) image.png

  2. 创建id的索引,只查看id字段会排序好,但查看全部依然没有排序。 image.png image.png image.png

创建索引的原则依据

索引虽可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。

  • 表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位
  • 记录数超过300行的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能。
  • 经常与其他表进行连接的表,在连接字段上应该建立索引。
  • 唯一性太差的字段不适合建立索引。
  • 更新太频繁的字段不适合创建索引。
  • 经常出现在 where子句中的字段,特别是大表的字段,应该建立索引。
  • 在经常进行 GROUP BY、ORDER BY的字段上建立索引
  • 索引应该建在选择性高的字段上。
  • 索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引。

索引的分类和创建

create table member (id int(10),name varchar(10),cardid int(18),phone int(11), address varchar(50),remark text);

image.png image.png

普通索引

最基本的索引类型,没有唯一性之类的限制。

  • 直接创建索引CREATE INDEX 索引名 ON 表名 (列名[(length)]);
    • (列名(length)):length是可选项,下同。如果忽略length的值,则使用整个列的值作为索引。如果指定,使用列的前length个字符来创建索引,这样有利于减小索引文件的大小。在不损失精确性的情况下,长度越短越好。并且只有字符串类型才能设置length的大小。
    • 索引名建议以“_index”结尾。

image.png image.png

  • 修改表方式创建ALTER TABLE 表名 ADD INDEX 索引名 (列名); image.png image.png

  • 创建表的时候指定索引CREATE TABLE表名(字段1 数据类型,字段2 数据类型[,...],INDEX 索引名(列名)); image.png

唯一索引

唯一索引:与普通索引类似,但区别是唯一索引列的每个值都唯一。唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引

  • 直接创建唯一索引CREATE UNIQUE INDEX 索引名 ON 表名(列名); image.png

  • 修改表方式创建ALTER TABLE 表名 ADD UNIQUE 索引名 (列名); image.png

注意:如果表格中某字段中有两条记录的该字段内容相同,则无法为该字段添加唯一索引。同样,添加了唯一索引的字段无法增加内容相同的记录。 image.png image.png

  • 创建表的时候指定CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名)); image.png

主键索引

主键索引:是一种特殊的唯一索引,必须指定为"PRIMARY KEY"。一个表只能有一个主键,不允许有空值。添加主键将自动创建主键索引

  • 创建表的时候指定CREATE TABLE 表名 ([...],PRIMARY KEY (列名)); image.png

  • 修改表方式创建ALTER TABLE 表名 ADD PRIMARY KEY (列名); image.png

组合索引(单列索引与多列索引)

组合索引(单列索引与多列索引):可以是单列上创建的索引,也可以是在多列上创建的索引。需要满足最左原则,因为select语句的 where条件是依次从左往右执行的,所以在使用select 语句查询时 where 条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。

  • 直接创建索引CREATE INDEX 索引名 on 表名(字段1,字段2,字段3); image.png image.png

  • 修改表方式创建ALTER TABLE 表名 ADD INDEX 组合索引名 (字段1,字段2,字段3,...) image.png

  • 创建表的时候指定CREATE TABLE 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型, INDEX 索引名 (列名1,列名2,列名3)); image.png

注意:查询时,where指定的条件要按照组合索引的顺序,索引才会生效。 image.png

唯一组合索引

多个字段组合的值不能重复,其中某个单列是可以重复的 image.png

这种情况下,单个或多个字段有多条记录重复并没有问题,只要设置的所有字段不完全一样即可。 image.png image.png

全文索引

全文索引:适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。
在MySQL5.6版本以前,FULTEXT索引仅可用于MyISAM引擎,在5.6版本之后innodb引擎也支持FULLTEXT索引。全文索引可以在CHAR、VARCHAR或者TEXT类型的列上创建

  • 直接创建索引CREATE FULLTEXT INDEX 索引名 ON 表名 (列名); image.png

  • 修改表方式创建ALTER TABLE 表名 ADD FULLTEXT 索引名 (列名); image.png

  • 创建表的时候指定索引CREATE TABLE 表名 (字段1 数据类型[,...],FULLTEXT 索引名 (列名));数据类型可以为CHAR、VARCHAR 或者TEXT image.png

使用全文索引查询

SELECT * FROM 表名 WHERE MATCH(列名) AGAINST ('查询内容'); image.png

查询结果内容只要包含该单词(字符串)即可。 image.png

查看索引

show index from 表名;
show keys from 表名;

image.png

各字段含义

image.png

字段名含义
Table表的名称
Non_unique如果索引不能包括重复词,则为0;如果可以,则为1
Key_name索引的名称
Seq_in_index索引中的列序号,从1开始
Column_name列名称
Collation列以什么方式存储在索引中。在 MysQL 中,有值'A'(升序)或 NULL(无分类)
Cardinality索引中唯一值数目的估计值
Sub_part如果列只是被部分地编入索引,则为被编入索引的字符的数目。如果整列被编入索引,则为 NULL
Packed指示关键字如何被压缩。如果没有被压缩,则为NULL
Null如果列含有NULL,则含有 YES。如果没有,则该列含有NO
Index_type用过的索引方法(BTREE,FULLTEXT,HASH,RTREE)
Comment备注

删除索引

  • 方法一:drop index 索引名 on 表名; image.png

  • 方法二:alter table 表名 drop index "索引名"; image.png

删除主键索引

alter table 表名 drop primary key; image.png

explain命令分析

在select命令查看前加上explain,可以查看使用的索引。

image.png image.png

explain的相关参数

相关参数
possible_keys显示可能应用在这张表中的索引。
key实际使用的索引。如果为NULL,则没有使用索引。
key_len使用的索引的长度。在不损失精确性的情况下,长度越短越好。
ref显示索引的哪一列被使用了,如果可能,则是一个常数。
Extra关于MySQL如何解析查询的额外信息。

总结

索引的作用

  • 加快对大表或多表查询速度,对字段排序
  • 降低IO成本,排序成本
  • 唯一性索引还能保证字段值的唯一性
  • 加快多表连接、分组、排序、恢复数据库的速度

索引如何工作的

  • 没有索引时,每次查询都需要先全表扫描来定位某行数据,查询速度慢,IO资源消耗较大
  • 有索引时,会先进行索引查询,然后通过索引值的数据对应的物理地址定位到具体的数据行,从而加快查询速

创建索引时的建议

  • 行数较多的情况下,比如建议在超过300行的表的字段上创建索引
  • 建议在主键、外键字段,表连接字段,分组(group by)、排序(order by)、 where 常使用的字段,唯一性较好的字段上创建索引不建议在唯一性差的、会频繁更新的、大文本的字段上创建索引