MYSQL数据库--索引

135 阅读15分钟

前言

索引是一种特殊的数据库结构,由数据表中的一列或多列组合而成,可以用来快速查询数据表中有某一特定值的记录。本节将详细讲解索引的含义、作用和优缺点。

通过索引,查询数据时不用读完记录的所有信息,而只是查询索引列。否则,数据库系统将读取每条记录的所有信息进行匹配。

可以把索引比作新华字典的音序表。例如,要查“库”字,如果不使用音序,就需要从字典的 400 页中逐页来找。但是,如果提取拼音出来,构成音序表,就只需要从 10 多页的音序表中直接查找。这样就可以大大节省时间。

因此,使用索引可以很大程度上提高数据库的查询速度,还有效的提高了数据库系统的性能。

为什么要使用索引

索引就是根据表中的一列或若干列按照一定顺序建立的列值与记录行之间的对应关系表,实质上是一张描述索引列的列值与原表中记录行之间一 一对应关系的有序表。

索引是 MySQL 中十分重要的数据库对象,是数据库性能调优技术的基础,常用于实现数据的快速检索。

在 MySQL 中,通常有以下两种方式访问数据库表的行数据:

顺序访问

顺序访问是在表中实行全表扫描,从头到尾逐行遍历,直到在无序的行数据中找到符合条件的目标数据。

顺序访问实现比较简单,但是当表中有大量数据的时候,效率非常低下。例如,在几千万条数据中查找少量的数据时,使用顺序访问方式将会遍历所有的数据,花费大量的时间,显然会影响数据库的处理性能。

索引访问

索引访问是通过遍历索引来直接访问表中记录行的方式。

使用这种方式的前提是对表建立一个索引,在列上创建了索引之后,查找数据时可以直接根据该列上的索引找到对应记录行的位置,从而快捷地查找到数据。索引存储了指定列数据值的指针,根据指定的排序顺序对这些指针排序。

例如,在学生基本信息表 tb_students 中,如果基于 student_id 建立了索引,系统就建立了一张索引列到实际记录的映射表。当用户需要查找 student_id 为 12022 的数据的时候,系统先在 student_id 索引上找到该记录,然后通过映射表直接找到数据行,并且返回该行数据。因为扫描索引的速度一般远远大于扫描实际数据行的速度,所以采用索引的方式可以大大提高数据库的工作效率。

简而言之,不使用索引,MySQL 就必须从第一条记录开始读完整个表,直到找出相关的行。表越大,查询数据所花费的时间就越多。如果表中查询的列有一个索引,MySQL 就能快速到达一个位置去搜索数据文件,而不必查看所有数据,这样将会节省很大一部分时间。

索引的概念

  • 索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于c语言的链表通过指针指向数据记录的内存地址)。
  • 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。
  • 索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
  • 索引是表中一列或者若干列值排序的方法。
  • 建立索引的目的是加快对表中记录的查找或排序。(加快查询速度、对字段值进行排序

索引的作用

优点

  • 设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。
  • 当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。
  • 可以降低数据库的I/O成本,并且索引还可以降低数据库的排序成本。
  • 通过创建唯一性索引,可以保证数据表中每一行数据的唯一性。
  • 可以加快表与表之间的连接。
  • 使用分组和排序时,可大大减少分组和排序的时间。
  • 建立索引在搜索和恢复数据库中的数据时能显著提高性能。

缺点

  • 索引需要占用额外的磁盘空间。

    对于 MyISAM 引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址。
    而 InnoDB 引擎的表数据文件本身就是索引文件。(索引文件和数据文件是同一个)

  • 在插入和修改数据时要花费更多的时间、消耗更多性能,因为索引也要随之变动。

创建索引的原则依据

索引虽可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。

  • 表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位。
  • 记录数超过300行(或500行)的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能。(会影响IO和CPU的性能)
  • 经常与其他表进行连接的表,在连接字段上应该建立索引。
  • 唯一性太差的字段不适合建立索引。(因为字段值会有重复)
  • 更新太频繁地字段不适合创建索引。
  • 经常出现在 where 子句中的字段,特别是大表的字段,应该建立索引。
  • 在经常进行GROUP BY、ORDER BY的字段上建立索引。
  • 索引应该建在选择性高的字段上。(即重复性低的字段)
  • 索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引。(大字段建索引会增加磁盘空间,而且搜索起来会影响性能)

当一个表写入多、读取很少的时候,不需要建立索引。

唯一性太差的字段、更新太频繁地字段、大字段,不适合做索引。

索引的分类和创建

创建一个huoying表.png

普通索引

普通索引是最基本的索引类型,没有唯一性之类的限制。

直接创建索引

格式

 CREATE INDEX 索引名 ON 表名 (列名(length));

 eg:create index name_index on huoying(name);  #以name字段创建普通索引  create index address_index on huoying(address(4));  #指定address字段值的前4个字符做普通索引的值

  • (列名(length)):length是可选项,下同。如果忽略length 的值,则使用整个列的值作为索引。如果指定,使用列的前length个字符来创建索引,这样有利于减小索引文件的大小。在不损失精确性的情况下,长度越短越好。

  • 索引名建议以“index"结尾。

1.png

索引也相当于一个键

2.png

修改表方式创建索引

ALTER TABLE 表名 ADD INDEX 索引名(列名);

eg:ALTER TABLE huoying ADD INDEX phone_index(phone);   #以phone字段创建普通索引

3.png

创建表时指定索引

一般不在创建表的时候添加索引,会让插入数据变慢。

CREATE TABLE 表名(字段1数据类型,字段2数据类型[,...],INDEX 索引名 (列名));

 eg: create table haizei(id int(10) ,name varchar(10) ,address int(18), phone int(11) ,remark text,INDEX name_index(name));

4.png

删除索引:

 drop index name_index on huoying;       #直接删除索引

 alter table huoying DROP index phone_index;    #以修改表的方式删除索引

5.png

6..png

唯一索引(创建唯一键即创建唯一索引)

唯一索引:与普通索引类似,但区别是唯一索引列的每个值都唯一。
唯一索引 允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。

创建唯一键或者创建唯一索引都可实现。

直接创建唯一索引

 CREATE UNIQUE INDEX 索引名 ON 表名(字段名);

 eg : create unique index nam_index on huoying(name);

7.png

以修改表的方式创建

 ALTER TABLE 表名 ADD UNIQUE 索引名(字段名);

 eg : alter table huoying add unique phone_index(phone);

8.png

创建表的时候指定索引

 CREATE TABLE 表名(列名1 数据类型,列名2 数据类型,列名3 数据类型, INDEX 索引名(字段1,字段2,字段3));

 eg : create table aaa(id int(10),name varchar(10),phone int(11),index name_phone_index(name,phone)); 9.png

使用组合索引查询:

使用select查询时注意where的最左原则。查询字段的顺序要和组合索引保持一致,才能生效。

 select * from 表名 where 字段1=XXX and 字段2=XXX and ...;

 select * from aaa where name='www' and phone=123 and address=123;
这条查询语句,会使用到name_phone_address_index这个索引。

 select * from aaa where phone=123 and address=123 and name='www';
这条查询语句无法使用索引,因为查询字段的顺序和组合索引不一致。

10.png

全文索引

全文索引(FULLTEXT):适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。

在MySQL5.6版本以前FULLTEXT索引仅可用于MyISAM引擎,在5.6版本之后innodb 引擎也支持FULLTEXT 索引。

全文索引可以在CHAR、 VARCHAR 或者TEXT 类型的列上创建。

每个表一般只创建一个全文索引。

查询时只能匹配完整的单词/字符串。

方法一:直接创建索引

 create fulltext index 索引名 on 表名 (字段);

 eg : create fulltext index remark_index on aaa(remark);

方法二:修改表的方式创建索引

 alter table 表名 add fulltext 索引名 (字段);

 eg : alter table aaa add fulltext name_index(name);

13.png

方法三:创建表时指定索引

 create table 表名 (字段.... , fulltext 索引名 (字段));

 eg : create table www(id int(10),name varchar(10),fulltext name_index(name));

Snipaste_2022-10-24_11-03-54.png

全文索引的创建限制:

全文索引只能在char、varchar和text类型的字段上创建:

Snipaste_2022-10-24_11-07-02.png

使用全文索引查询:

全文索引查询时,只能匹配完整的单词或字符串。

 select * from 表名 where match(字段名) against(单词/字符串);   

 select * from www where match(remark) against('qqx');
查询remark字段包含字符串"vip"的数据记录。

 select * from member where match(remark) against('is');
这条语句查询不到匹配的记录,因为全文索引只能匹配完整的单词/字符串。

Snipaste_2022-10-24_11-17-26.png

使用explain命令分析:

可以使用explain命令分析一下,这个 select语句是否使用了索引或者索引使用是否正确。

 explain select * from www where match(remark) against('qqx')\G

Snipaste_2022-10-24_11-18-40.png

查看表中有哪些索引

 show index from 表名;       #能查看索引的字段和细节,建议以纵向形式查看
show index from 表名\G     #建议使用\G以纵向形式查看

 show keys from 表名;   show keys from 表名\G

 show create table 表名;     #只能查看索引的字段和名称

Snipaste_2022-10-24_11-21-08.png

Snipaste_2022-10-24_11-22-17.png

查询结果中,各字段的含义如下:

字段含义
Table表的名称
Non_unique如果索引不能包括重复词,则为0;如果可以,则为1
Key_name索引的名称
seq_in_index索引中的列序号,从1开始
column_name列名称
collation列以什么方式存储在索引中。在 MySQL中,有值"A"(升序)或 NULL(无分类)
Cardinality索引中唯一值数目的估计值
sub_part如果列只是被部分地编入索引,则为被编入索引的字符的数目。如果整列被编入索引,则为NULL
Packed指示关键字如何被压缩。如果没有被压缩,则为NULL
Null如果该列含有NULL值,则显示YES。如果没有,则显示NO或为空
lndex_type用过的索引方法(BTREE,FULLTEXT,HASH,RTREE)
comment备注

collation 值显示为'A',表示自动升序。

查询时仅显示该字段的话,会自动升序排列:

Snipaste_2022-10-24_12-22-56.png

seq_in_index表示索引中的序列号,从1开始:

Snipaste_2022-10-24_11-53-09.png

删除索引

除了删除主键索引,删除其他索引的方式是一样的。

删除主键索引(即删除主键)

 alter table 表名 drop primary key;   

Snipaste_2022-10-24_11-56-01.png

删除其他索引

 drop index 索引名 on 表名;      #直接删除索引

 alter table 表名 drop index 索引名;    #修改表的方式删除索引

 eg : drop index address_index on www;     #直接删除索引
alter table www drop index name_address_phone_index;   #修改表的方式删除索引

Snipaste_2022-10-24_11-59-08.png

概述:

  • 创建索引--普通索引:

  1. create index 索引名 on 表名 (字段);

  2. alter table 表名 add index 索引名 (字段(4));

  3. create table 表名 (字段.... , index 索引名(字段));

  • 唯一索引:

  1. create unique index 索引名 on 表名 (字段);

  2. alter table 表名 add unique 索引名(字段);

  3. create table 表名 (字段.... , unique 索引名(字段));

  • 主键索引:

  1. alter table 表名 add primary key (字段);

  2. create table 表名 (字段.... , primary key (字段));

  3. create table 表名 (字段 primary key, ... );

  • 组合索引(单列、多列索引):

  1. create index XXX_index on 表名 (字段1,字段2, ... , 字段n);

  2. alter table 表名 add index XXX_index (字段1,字段2, ... , 字段n);

  3. create table 表名(列名1 数据类型,列名2 数据类型,列名3 数据类型, INDEX 索引名(字段1,字段2,字段3));

  • 使用时要注意 where 的最左原则:

  1. select * from 表名 where 字段1=XXX and 字段2=XXX and ....

  • 全文索引:

  1. create fulltext index 索引名 on 表名 (字段);

  2. alter table 表名 add fulltext 索引名 (字段);

  3. create table 表名 (字段.... , fulltext 索引名(字段));

  • 查询时只能匹配完整的字符串:

  1. select * from 表名 where match(字段) against('查询字符串');

  • 查询表中有哪些索引

  1. show index from 表名; //能查看索引的字段和细节,建议使用\G纵向查看

  2. show keys from 表名;

  3. show create table 表名; //只能查看索引的字段和名称

  • 删除索引---删除主键索引的方法:

  1. alter table 表名 drop primary key;

  • 删除其他索引:

  1. drop index 索引名 on 表名;
  2. alter table 表名 drop index 索引名;

索引的作用:加快查询速度,对字段进行排序。
缺点:索引需要占用额外的磁盘空间。
对于 MyISAM 引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址。
而 InnoDB 引擎的表数据文件本身就是索引文件。(索引文件和数据文件是同一个)
在插入和修改数据时要花费更多的时间、消耗更多性能,因为索引也要随之变动。

索引是如何提高查询速度的

  • 索引包含着对数据表里所有记录的引用指针。索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址。
  • 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。

select 语句的慢查询问题,如何处理?
使用 explain 命令,即 explain select ...; 分析一下 这个 select语句是否使用了索引或者索引使用是否正确。
如果没有用索引或者索引用得不正确,可以使用 create index 索引名 on 表名 (字段);  或者 alter table 表名 add index 索引名(字段);  添加索引去优化查询速度。

  • 索引失效常见原因

  1. 不满足最左前缀原则

  2. 范围索引列没有放在最后

  3. 使用了select*

  4. 索引列上有计算

  5. 索引列上使用了函数

  6. 字符类型没加引号

  7. 用is null和is not null没注意字段是否允许为空

  8. like查询左边有%

  9. 使用or关键字时没注意

  • 索引失效常见误区

  1. 使用not in会导致索引失效

  2. 使用不等于号会导致索引失效

  3. order by索引字段顺序不当导致索引失效

  • 索引设计的几个建议

  1. 优先使用唯一索引
  2. 为常用查询字段建索引
  3. 为排序、分组和联合查询字段建索引
  4. 一张表的索引数量不超过5个
  5. 表数据量少,可以不用建索引
  6. 尽量使用占用空间小的字段建索引
  7. 用idx_或unx_等前缀命名索引
  8. 删除没用的索引