MySQL学习-一条SQL语句的查询过程

511 阅读5分钟

「这是我参与11月更文挑战的第15天,活动详情查看:2021最后一次更文挑战

作者:汤圆

个人博客:javalover.cc

前言

mysql主要分为服务层存储引擎层,这个分层跟MVC有点类似;

而一条查询语句的执行过程,就是先在服务层做处理:连接器、分析器、优化器、执行器;

然后再调用引擎接口去存储引擎层拿数据;

下面我们就从一条简单的查询语句来介绍下上面的各个步骤:

select * from T where id = 10;

本文的介绍都是基于InnoDB引擎

目录

  1. 连接器
  2. 分析器
  3. 优化器
  4. 执行器

正文

1. 连接器

在执行一条查询语句之前,首要条件就是建立客户端和服务端之间的连接;

这里我们用命令行的方式来建立连接:mysql -u root -h localhost -p;,然后根据提示输入密码即可,如下所示

jalon@xxx ~ % mysql -u root -h localhost -p;     
Enter password: 
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 13
Server version: 8.0.21 Homebrew

Copyright (c) 2000, 2020, Oracle and/or its affiliates. All rights reserved.

Oracle is a registered trademark of Oracle Corporation and/or its
affiliates. Other names may be trademarks of their respective
owners.

Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.

这样我们就建立了客户端和服务器之间的连接;

关于连接又分为短连接和长连接:

  • 长连接【推荐】:就是建立连接后,如果持续有请求进来,就一直保持连接;
  • 短连接:就是建立连接后,执行几次查询就断开连接;

为什么我们要推荐长连接呢?

因为建立连接的过程是复杂的,需要消耗很多资源,所以推荐用长连接;

但是长连接这里也有几个点,需要我们注意一下:

  1. 长连接可能导致典型的8小时问题,就是建立长连接后,超过8小时没有请求进来,连接就会断开;此时再去执行请求,就会报错提示连接已断开;
  2. 长连接可能导致OOM,因为建立连接后,后续mysql操作使用的临时内存都是存在连接对象中,如果长连接过多,可能会导致内存占用过大,从而导致OOM(结果就是mysql异常重启);

不过万事都有解决的办法:

  1. 针对8小时问题,我们可以定时发送一个请求,去让连接活跃起来
  2. 针对OOM问题,我们可以定期初始化连接对象(只支持mysql5.7+,命令为mysql_reset_connection),就是只清除连接对象中的临时内存,不清除连接信息,使得连接恢复到刚开始的样子;如果是mysql5.7以下的版本,可以考虑定期断开长连接,重新建立一次连接;

2. 分析器

等到上面的连接建立完成,就该执行分析器了;

但是mysql8.0之前还要先去查询缓存:就是先去查询缓存中查看,前面是否调用过该查询,如果有,则直接返回结果;如果没有再去执行分析器;

之所以mysql8.0没有这个查询缓存的功能,是因为查询缓存功能有点鸡肋了:因为只要一个表中执行了一次更新语句,那么这个表前面的缓存就都失效了;

分析器的作用就是分析这条语句的目的是什么;

分析器主要分为词法分析和语法分析;

  • 词法分析:分析语句的功能(比如select就是查询语句)、表名、字段名;
  • 语法分析:分析语法是否正确(像我们平时看到的报错提示语法错误就是这个语法分析的功能);

3. 优化器

优化器的作用显而易见,就是负责优化SQL语句的;

优化器的功能主要体现在两个方面:

  1. 如果涉及到多个索引,优化器会自动选择最优的索引(也可能会选错)
  2. 如果涉及到多表联合查询,优化器会自动优化表的连接顺序

关于多表联合查询,我们可以看个简单的例子,比如:

select * from t1 join t2 using(ID) where t1.c=10 and t2.d=20

如果不优化,那么默认会先去查询t1.c=10,再去查询t2.d=20;

可是如果满足t1.c=10的结果很多,而满足t2.d=20的结果很少,那么这个默认的查询就会很慢;

此时如果有优化器的存在,他就会自动调整连接的顺序,先查询t2.d=20,再去查询t1.c=10;

优化完之后,就会进行到下一步,执行器

4. 执行器

执行器在执行语句之前,会先进行权限检查,即该用户对该表有没有select权限(或者其他权限)

为什么这个权限检查没有放在前面的阶段进行,要等到最后一步呢?

因为有些时候,SQL语句要操作的表并不只是SQL字面上的那些;

比如如果有个触发器,要在执行器阶段才能确定。前面的阶段是无能为力的。

下面我们还是以开头的那个查询语句为例:

select * from T where id = 10;

权限检查通过后,会去判断条件id是不是索引:

  • 如果是索引,就会调用InnoDB引擎去表中取出满足条件的第一行,存到结果集,然后重复取满足条件的行
  • 如果不是索引,就会调用InnoDB引擎去表中取出第一行,判断是否id=10;
    • 如果不是,就继续取下一行进行判断
    • 如果是,就存到结果集,然后重复取下一行进行判断;

至此一条SQL语句的查询过程就算完了。

总结

一条SQL的语句的查询过程主要分4个步骤:建立连接、分析语句、优化语句、执行查询