携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第27天,点击查看活动详情
查询缓存
MySQL 内部自带了一个缓存模块。
在没有索引的字段上执行两次同样的查询:
select * from user_innodb where name='青山';
缓存没有生效,为什么?MySQL 的缓存默认是关闭的。
show variables like 'query_cache%';
因为 MySQL 自带的缓存的应用场景有限。
第一个是它要求 SQL 语句必须一模一样,例如中间多一个空格、字母大小写不同都被认为是不同的的 SQL。
第二个是表里面任何一条数据发生变化的时候,这张表所有缓存都会失效,所以对于有大量数据更新的应用,也不适合。
缓存这一块,还是交给 ORM 框架,或者独立的缓存服务,比如 Redis 来处理更合适。
在 MySQL 8.0 中,查询缓存已经被移除了。
语法解析和预处理(Parser & Preprocessor)
假如随便执行一个字符串 penyuyan,服务器报了一个 1064 的错:
[Err] 1064 - You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'penyuyan' at line 1
它是怎么知道输入的内容是错误的?
这个就是 MySQL 的 Parser 解析器和 Preprocessor 预处理模块。
这一步主要做的事情是对 SQL 语句进行词法和语法分析和语义的解析。
词法解析
词法分析就是把一个完整的 SQL 语句打碎成一个个的单词。
比如一个简单的 SQL 语句:
select name from user where id = 1;
它会打碎成 8 个符号,每个符号是什么类型,从哪里开始到哪里结束。
语法解析
第二步就是语法分析,语法分析会对 SQL 做一些语法检查,比如单引号有没有闭合,然后根据 MySQL 定义的语法规则,根据 SQL 语句生成一个数据结构。
这个数据结构我们把它叫做解析树(select_lex)。
词法语法分析是一个非常基础的功能,编译器、搜索引擎如果要识别语句,必须也要有词法语法分析功能。
预处理器
如果写了一个词法和语法都正确的 SQL,但是表名或者字段不存在,会在哪里报错?是解析的时候报错还是执行的时候报错?
比如:
select * from penyuyan;
实际上还是在解析的时候报错,解析 SQL 的环节里面有个预处理器。它会检查生成的解析树,解决解析器无法解析的语义。比如,它会检查表和列名是否存在,检查名字和别名,保证没有歧义。
预处理之后得到一个新的解析树。
查询优化(Query Optimizer)与查询执行计划
什么是优化器?
解析树是一个可以被执行器认识的数据结构。
一条SQL语句是不是只有一种执行方式?或者说数据库最终执行的SQL是不是就是发送的 SQL?
这个答案是否定的。一条 SQL 语句是可以有很多种执行方式的,最终返回相同的结果,他们是等价的。但是如果有这么多种执行方式,这些执行方式怎么得到的?最终选择哪一种去执行?根据什么判断标准去选择?
这个就是 MySQL 的查询优化器的模块(Optimizer)。
查询优化器的目的就是根据解析树生成不同的执行计划(Execution Plan),然后选择一种最优的执行计划,MySQL 里面使用的是基于开销(cost)的优化器,哪种执行计划开销最小,就用哪种。
可以使用这个命令查看查询的开销:
show status like 'Last_query_cost';
参数说明,click me!
优化器可以做什么?
MySQL 的优化器能处理哪些优化类型呢?
举两个简单的例子:
1、当我们对多张表进行关联查询的时候,以哪个表的数据作为基准表(先访问哪张表)。
2、有多个索引可以使用的时候,选择哪个索引。
3、对于查询条件的优化,比如移除 1=1 之类的恒等式,移除不必要的括号,表达式的计算,子查询和连接查询的优化。 ……
经过优化器处理之后,得到一个什么东西呢?
优化器得到的结果
优化器最终会把解析树变成一个执行计划(execution_plans),执行计划也是一个数据结构。
当然,这个执行计划是不是一定是最优的执行计划呢?不一定,因为 MySQL 也有可能覆盖不到所有的执行计划。
我们怎么查看 MySQL 的执行计划呢?比如多张表关联查询,先查询哪张表?在执行查询的时候可能用到哪些索引,实际上用到了什么索引?
MySQL 提供了一个执行计划的工具。我们在 SQL 语句前面加上 EXPLAIN,就可以看到执行计划的信息。
EXPLAIN select name from user where id=1;
如果要得到详细的信息,还可以用 FORMAT=JSON