Mysql 数据库索引类型上

173 阅读3分钟

「这是我参与 2022 首次更文挑战的第 27 天,活动详情查看:2022 首次更文挑战

坤至柔而动也刚,至静而德方。

前言

数据库索引是 mysql 数据库中重要的组成部分,是数据库查询数据速度提升的关键,本文将介绍数据库索引的一些内容。

数据库索引的数据结构

在数据库中的索引方法中,有 TREEHASH 两种方法,HASH 是经常使用的,本文中主要介绍 TREE 的数据结构。B+Tree 的高度一般是 2-4 层,也就是说查找一条数据记录,最多使用 2-4 次 IO,当前一般的机械磁盘每秒至少可以做 100 次 IO, 2-4 词的 IO 操作时间大概耗时 20-40ms。

数据库中的 B+Tree 索引分为聚集索引(clustered index)和辅助索引(secondary index),聚集索引和还是非聚集索引其内部的数据结构为平衡二叉树,所有的数据都存放在叶子节点,聚集索引存放的是一整行的数据,而辅助索引的叶子节点存放的是主键 id。 需要提一下的是 B+Tree 是一个自底向上生长的树,在数据库表中的数据进行增长时,B+Tree 也会进行增长和分裂。

聚集索引

聚集索引就是按照每张表的主键 id 构造出的一个 B+Tree,同时叶子节点存放的是整行表的数据记录,所以聚集索引的叶子节点就是数据页,每个叶子节点所在的数据页通过双向链表来进行链接。

数据页智能按照一个 B+Tree 进行排序,因此每张表智能由一个聚集索引。大多数情况下,查询优化器首先采用聚集索引,因为聚集索引上的叶子结点能够直接找到数据记录。由于数据是按照顺序排列的,索引聚集索引对于主键的排序查找和范围值的查询速度非常快。

辅助索引

辅助索引也是非聚集索引,叶子节点并不包含行记录的全部数据。叶子节点除了包含的主键值外,每个叶子结点中的索引行还包含一个书签(bookmark)。借助这个书签 InnoDB 能够很快找到索引对应的行记录。InnoDB 存储引擎是索引组织表,因此辅助索引的书签就是相应行数据的聚集索引。

数据库表中的聚集索引只有一个,辅助索引可以有多个,当通过辅助索引来查找数据时,InnoDB 存储引擎会遍历辅助索引并通过叶级别的指针获得指向主键索引的主键,然后通过主键索引来找到完整的行记录。如果辅助索引树的高度为 3,聚集索引树的高度同样为 3,那么如果需要找到一个完整的行记录数据,一共需要 6 次逻辑 IO 访问才能拿到数据页。

索引管理

索引的创建和删除方法如下:

# 创建和删除方法如下
alter table table_name  index_name
create table table_name index_name
drop table table_name index_name
# 查询数据库表的索引
show index from table_name

如下图所示,查询数据库表中的索引情况: 表中的实际索引如下:

PRIMARY KEY (`id`),
UNIQUE KEY `uk_tb_user_2` (`username`,`id_card`) USING BTREE,
UNIQUE KEY `uk_tb_user_1` (`username`,`cellphone`) USING BTREE

在索引的展示项中,索引的值 cardinality 是非常重要的选项,表示的是数据基数即是数据中不同元素的个数,如果数据内容为枚举,则再该列上建立索引就没有多大意义,因为去分部不大。但是这个值不是实时更新的,只能作为参考。如果需要更新,则执行以下命令:

analyze table table_name;

总结

本文介绍了 mysql 数据库的数据结构以及索引类型,了解了数据库的重要参数项 cardinality