MySQL执行SQL会经过SQL解析和查询优化的过程,解析器将SQL分解成数据结构并传递到后续步骤,查询优化器发现执行SQL查询的最佳方案、生成执行计划。查询优化器决定SQL如何执行,依赖于数据库的统计信息,下面我们介绍MySQL 5.7中innodb统计信息的相关内容。
MySQL统计信息的存储分为两种,非持久化和持久化统计信息。
非持久化统计信息存储在内存里,如果数据库重启,统计信息将丢失。有两种方式可以设置为非持久化统计信息:
非持久化统计信息的缺点显而易见,数据库重启后如果大量表开始更新统计信息,会对实例造成很大影响,所以目前都会使用持久化统计信息。
二、持久化统计信息
,持久化统计信息保存在表和。是表的统计信息,是索引的统计信息,各字段含义如下:为更好的理解,建一张测试表做说明:CREATE TABLE t1 (
a INT, b INT, c INT, d INT, e INT, f INT,
PRIMARY KEY (a, b), KEY i1 (c, d), UNIQUE KEY i2uniq (e, f)
) ENGINE=INNODB;和字段时:表示索引的页的数量时:表示叶子节点的数量时:表示索引字段上唯一值的数量,此处做一下具体说明:表示索引第一列之后的数量,如的a列,只有一个值1,所以时,。表示索引前两列之后的数量,如的列,有4个值,所以时,。,在原索引列c,d后加了主键列的结果为2。和的具体含义,就可以协助我们排查SQL执行时为什么没有使用合适的索引,例如某个索引的远小于实际值,查询优化器认为该索引选择度较差,就有可能导致使用错误的索引。中统计信息差别较大引起,可通过以下方式处理:;2、如果更新后统计信息仍不准确,可考虑增加表采样的数据页,两种方式可以修改:
,默认为20;;的最大值是65535,超出会报错。目前MySQL并没有提供直方图的功能,某些情况下(如数据分布不均)仅仅更新统计信息不一定能得到准确的执行计划,只能通过
的方式指定索引。新版本8.0会增加直方图功能,让我们期待MySQL越来越强大的功能吧!




