存储引擎的概念
什么是存储引擎
- MySQL中的数据用各种不下同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎。
- 存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式。
- 存储引擎是MySQL数据库中的组件,负责执行实际的数据I/O操作。
- MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储。
MySQL常用的存储引擎:
- MylSAM
- InnoDB
注意:一个表只能使用一个存储引擎,一个库中不同的表可以使用不同的存储引擎。
MyISAM存储引擎
MylSAM介绍
- MylSAM不支持事务,也不支持外键约束,只支持全文索引,数据文件和索引文件是分开保存的。
- 访问速度快,对事务完整性没有要求。
- MylSAM适合查询、插入为主的应用。
- MylSAM在磁盘.上存储成三个文件,文件名和表名都相同,但是扩展名分别为:
- .frm文件存储表结构的定义
- 数据文件的扩展名为.MYD (MYData)
- 索引文件的扩展名是.MYI (MYIndex)
MylSAM的特点
- 表级锁定形式,数据在更新时锁定整个表。
- 数据库在读写过程中相互阻塞:
- 会在数据写入的过程阻塞用户数据的读取
- 也会在数据读取的过程中阻塞用户的数据写入
- 数据单独写入或读取,速度过程较快且占用资源相对少。
MyISAM表支持3种不同的存储格式
静态(固定长度)表
静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多。 静态格式是MyISAM表的默认存储格式。当表不包含变量长度列(VARCHAR, BLOB, 或TEXT)时,使用这个格式。每一行用固定字节数存储。静态格式是三种存储格式中最简单和最安全的,同时也是最快的ondisk格式。
基本特征:
- CHAR列对列宽度为空间填补。
- 快速。
- 容易缓存。
- 由于每个记录位置固定,崩溃后容易重建。(5)无必要重新组织,通常比动态表需要更大的磁盘空间。
动态表
动态表包含可变字段,记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行OPTIMIZE TABLE语句或myisamchk-r命令来改善性能,并且出现故障的时候恢复相对比较困难(因为会产生磁盘碎片,而且存储空间不是连续的)。
动态表特征(动态格式)
如果一个MyISAM表包含任何可变长度 列(VARCHAR, BLOB或TEXTDynamic),或者如果一个表被用ROW_FORMAT=DYNAMIC选项来创建,动态存储格式被使用。
基本特征:
- 除了长度少于4的列之外,所有的字符串列存储为动态。
- 每个记录前存储一个位图,该位图表明哪一列包含空字符串(对于字符串列)或者0(对于数字列),但并不包括包含NULL值的列。而非空字符串列,则会被存为一个长度字节加字符串的内容。
- 动态格式表在崩溃后要比静态格式表更难重建,因为一个记录可能被分为多个碎片且链接(碎片)可能被丢失。
- 每个记录仅使用必需大小的空间。尽管如此,如果一个记录变大,它就按需要被分开成多片,造成记录碎片的后果。比如,你用扩展行长度的信息更新一行,该行就变得有碎片。在这种情况下,你可以时不时运行OPTIMIZE TABLE或myisamchk -r来改善性能。可使用myisamchk -ei来获取表的统计数据。
压缩表
压缩表由 myisamchk 工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支。(压缩的过程中会占用CPU性能)
已压缩表特征(已压缩格式)
MySQL分发版本里默认包含myisampack工具,已压缩存储格式是由它创建的只读格式。
压缩表有下列特征:
- 压缩表占据很小的磁盘空间,最小化了磁盘用量。
- 每个记录被单独压缩,访问开支小。
- 可以处理固定长度或动态长度记录。
MyISAM使用的生产场景举例
- 公司业务不需要事务的支持
- 单方面读取或写入数据比较多的业务
- MylSAM存储引擎数据读写都比较频繁场景不适合(因为读写是互相阻塞的)
- 使用读写并发访问相对较低的业务
- 数据修改相对较少的业务
- 对数据业务-致性要求不是非常高的业务
- 服务器硬件资源相对比较差(MyISAM占用资源相对少)
InnoDB存储引擎
InnoDB介绍
-
支持事务,支持4个事务隔离级别
-
MySQL从5.5.5版本开始,默认的存储引擎为InnoDB
-
读写阻塞与事务隔离级别相关
-
能非常高效的缓存索引和数据
-
表与主键以簇的方式存储 BTREE
-
支持分区、表空间,类似oracle数据库
-
支持外键约束,5.5前不支持全文索引,5.5后支持全文索引
-
对硬件资源要求还是比较高的场合
-
行级锁定,但是全表扫描仍然会是表级锁定,如
- update table set a=1 where user like '%zhang%';
注:
- 使用like进行模糊查询时,会进行全表扫描,锁定整个表。
- 对没有创建索引的字段进行查询,也会进行全表扫描锁定整个表。
- 使用索引进行查询,则是行级锁定。
InnoDB的特点
- InnoDB中不保存表的行数,如
select count(*) from table;时,InnoDB需要扫描一遍整个表来计算有多少行,但是MyISAM只要简单的读出保存好的行数即可。需要注意的是当count(*)语句包含where条件时MyISAM也需要扫描整个表。 - 对于自增长的字段,InnoDB 中必须包含只有该字段的索引,但是在MyISAM表中可以和其他字段一起建立组合索引。
- delete清空整个表时,InnoDB 是一行一 行的删除,效率非常慢。MyISAM则会重建表。
InnoDB适用生产场景分析
-
业务需要事务的支持。
-
行级锁定对高并发有很好的适应能力,但需确保查询是通过索引来完成。
-
业务数据更新较为频繁的场景。
- 如:论坛,微博等。
-
业务数据一致性要求较高。
- 如:银行业务。
-
硬件设备内存较大,利用InnoDB较好的缓存能力来提高内存利用率,减少磁盘IO的压力。
MyISAM和InnoDB的区别:
MyISAM: : 不支持事务和外键约束,占用空间较小,访问速度快,表级锁定,支持全文索引,适用于不需要事务处理、单独写入或查询的应用场景。(写入和查询不一起使用的场景)
InnoDB: : 支持事务处理、外键约束、占用空间比MyISAM 大,支持行级锁定,5.5版本后支持全文索引,读写开发能力较好,适用于需要事务处理、读写频繁,一致性要求高,数据更新频繁的应用场景。