本文已参与「新人创作礼」活动,一起开启掘金创作之路。
1. MySQL体系结构
MySQL的架构分为三个层次,这三个层次分别代表:Client、Mysql Server、引擎层、存储层。
分开来看,首先客户端要向MySQL Server发送一个连接请求,意味着MySQL Server需要一个提供连接的服务,叫做“连接器”,比如权限认证(用户名和密码的匹配)就是在这里完成的。
在接下来是“分析器”,SQL语句本身是一个字符串,MySQL服务需要将SQL语句进行切分,例如按照“select”、“from”、“where”这些关键词进行切分,进行词法分析和语法分析,最终变成抽象语法树AST。
一个SQL语句其实有n中不同的执行方式,需要MySQL优化器进行相关的选择。所以在分析器的下一层,还包含优化器,也就是说MySQL里面其实自带优化了,但这个优化是一个通用的规则,只能够适配绝大部分的场景。
除此之外,优化器是分两种不同的方式,RBO和CBO,RBO是基于规则的优化,CBO是基于成本的优化,或者叫基于代价的优化。在一些SQL服务里,更多的是CBO这种方式,因为在一些应用开发时,最终的目的时要满足与查询速度比较快,这是一个最基本的需求,因此很多是基于成本的优化。
最后一个是“执行器”,执行器用来和存储引擎进行交互,也就是说从磁盘读取数据或者写入数据到磁盘中。
存储引擎层, 存储引擎真正的负责了MySQL中数据的存储和提取,服务器通过API和存储引擎进行通信。不同的存储引擎具有不同的功能,这样可以根据自己的需要,来选取合适的存储引擎。数据库中的索引是在存储引擎层实现的。
数据存储层, 主要是将数据(如: redolog、undolog、数据、索引、二进制日志、错误日志、查询日志、慢查询日志等)存储在文件系统之上,并完成与存储引擎的交互。
2. 存储引擎简介
存储引擎就是存储数据、建立索引、更新/查询数据等技术的实现方式 。存储引擎是基于表的,而不是基于库的,所以存储引擎也可被称为表类型。可以在创建表的时候,来指定选择的存储引擎,如果没有指定将自动选择默认的存储引擎。
建表时指定存储引擎
CREATE TABLE 表名(
字段1 字段1类型 [ COMMENT 字段1注释 ] ,
......
字段n 字段n类型 [COMMENT 字段n注释 ]
) ENGINE = INNODB [ COMMENT 表注释 ] ;
查询当前数据库支持的存储引擎
show engines;
例如, 创建表 my_myisam , 并指定MyISAM存储引擎
create table my_myisam(
id int,
name varchar(10)
) engine = MyISAM ;
指定Memory存储引擎
create table my_memory(
id int,
name varchar(10)
) engine = Memory ;
3. 存储引擎特点
3.1 InnoDB
InnoDB是一种兼顾高可靠性和高性能的通用存储引擎,在 MySQL 5.5 之后,InnoDB是默认的MySQL 存储引擎。
特点
- DML操作遵循ACID模型,支持事务;
- 行级锁,提高并发访问性能;
- 支持外键FOREIGN KEY约束,保证数据的完整性和正确性;
文件
xxx.ibd:xxx代表的是表名,innoDB引擎的每张表都会对应这样一个表空间文件,存储该表的表结构(frm-早期的 、sdi-新版的)、数据和索引。
参数:innodb_file_per_table
show variables like 'innodb_file_per_table';
如果该参数开启,代表对于InnoDB引擎的表,每一张表都对应一个ibd文件。 MySQL的数据存放目录:
可以看到里面有很多的ibd文件,每一个ibd文件就对应一张表,比如:有一张表 account,就有这样的一个account.ibd文件,而在这个ibd文件中不仅存放表结构、数据,还会存放该表对应的索引信息。 而该文件是基于二进制存储的,不能直接基于记事本打开,如果是MySQL 8版本可以使用mysql提供的一个指令 ibd2sdi ,通过该指令就可以从ibd文件中提取sdi信息,而sdi数据字典信息中就包含该表的表结构。
逻辑存储结构
- 表空间 : InnoDB存储引擎逻辑结构的最高层,ibd文件其实就是表空间文件,在表空间中可以包含多个Segment段。
- 段 : 表空间是由各个段组成的, 常见的段有数据段、索引段、回滚段等。InnoDB中对于段的管理,都是引擎自身完成,不需要人为对其控制,一个段中包含多个区。
- 区 : 区是表空间的单元结构,每个区的大小为1M。 默认情况下, InnoDB存储引擎页大小为16K, 即一个区中一共有64个连续的页。
- 页 : 页是组成区的最小单元,页也是InnoDB存储引擎磁盘管理的最小单元,每个页的大小默认为 16KB。为了保证页的连续性,InnoDB 存储引擎每次从磁盘申请 4-5 个区。
- 行 : InnoDB 存储引擎是面向行的,也就是说数据是按行进行存放的,在每一行中除了定义表时所指定的字段以外,还包含两个隐藏字段。
3.2 MyISAM
MyISAM是MySQL早期的默认存储引擎。
特点
- 不支持事务,不支持外键
- 支持表锁,不支持行锁
- 访问速度快
文件
xxx.sdi:存储表结构信息
xxx.MYD: 存储数据
xxx.MYI: 存储索引
xxx.sdi可以直接打开查看【JSON格式】
3.3 Memory
Memory引擎的表数据时存储在内存中的,由于受到硬件问题、或断电问题的影响,只能将这些表作为临时表或缓存使用。
特点
- 内存存放
- 支持hash索引(默认)
文件
xxx.sdi:存储表结构信息
3.4 区别及特点
| 特点 | InnoDB | MyISAM | Memory |
|---|---|---|---|
| 存储限制 | 64TB | 有 | 有 |
| 事务安全 | 支持 | - | - |
| 锁机制 | 行锁 | 表锁 | 表锁 |
| B+tree索引 | 支持 | 支持 | 支持 |
| Hash索引 | - | - | 支持 |
| 全文索引 | 支持(5.6版本以后) | 支持 | - |
| 空间使用 | 高 | 低 | N/A |
| 内存使用 | 高 | 低 | 中等 |
| 批量插入速度 | 低 | 高 | 高 |
| 支持外键 | 支持 | - | - |
4. 存储引擎选择
在选择存储引擎时,应该根据应用系统的特点选择合适的存储引擎。对于复杂的应用系统,还可以根据实际情况选择多种存储引擎进行组合。
- InnoDB: 是Mysql的默认存储引擎,支持事务、外键。如果应用对事务的完整性有比较高的要求,在并发条件下要求数据的一致性,数据操作除了插入和查询之外,还包含很多的更新、删除操作,那么InnoDB存储引擎是比较合适的选择。
- MyISAM : 如果应用是以读操作和插入操作为主,只有很少的更新和删除操作,并且对事务的完整性、并发性要求不是很高,那么选择这个存储引擎是非常合适的。
- MEMORY:将所有数据保存在内存中,访问速度快,通常用于临时表及缓存。MEMORY的缺陷就是对表的大小有限制,太大的表无法缓存在内存中,而且无法保障数据的安全性。
对于MyISAM类型的存储引擎现在已经被MongoDB这种nosql替代了,而MEMORY类型的存储引擎现已被另一种nosql替代了,也就是Redis