MySQL回表的性能伤害有多大?

178 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第30天,点击查看活动详情

1 回表的性能消耗

无论单列索引 or 联合索引,一个索引就对应一个独立的B+索引树,索引树节点仅包含:

  • 索引里的字段值
  • 主键值

即使根据索引树按条件找到所需数据,也仅是索引里的几个字段的值和主键值,万一你搞个select *,那就还得其他字段,就需回表,根据主键到聚簇索引里找,聚簇索引的叶节点是数据页,找到数据页才能把一行数据所有字段值读出来。

所以类似

select * from table order by xx1,xx2,xx3

得从联合索引的索引树里按序取出所有数据,接着对每条数据都走一个主键的聚簇索引查找,性能不高。

有时MySQL执行引擎可能认为,你要是类似

select * from table order by xx1,xx2,xx3

相当于得把联合索引和聚簇索引,两个索引的所有数据都扫描一遍,那还不如不走联合索引,直接全表扫描得了,这样就只需扫描一个主键索引。

但若形如:

select * from table order by xx1,xx2,xx3 limit 10

那执行引擎就知道你先扫描联合索引的索引树,拿到10条数据,接着对10条数据在聚簇索引里查找10次即可,那就还是会走联合索引。

2 覆盖索引

覆盖索引不是一种索引,只是一种基于索引查询的方式,即针对类似

select xx1,xx2,xx3 from table order by xx1,xx2,xx3

仅需联合索引里的几个字段的值,那就只需扫描联合索引的索引树,无需回表找其它字段,这种查询方式就是覆盖索引。

所以当你使用联合索引时,注意是否可能会导致大量回表到聚簇索引,若回表聚簇索引的次数太多,可能就直接给你做成全表扫描而不走联合索引了。

尽可能还是在SQL里指定你仅需要的字段,而不要暴力select *,最好直接走覆盖索引。

即使无可避免地要回表,你也尽可能用limit、 where限定一下回表的次数,就从联合索引里筛选少数数据,再回表,这样性能好一点。