MySQL索引 ,事务与存储引擎
MySQL索引
一.MySQL索引
1.1 数据库概念
- 索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于c语言的链表通过指针指向数据记录的内存地址)·
- 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。
- 索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
- 索引是表中一列或者若干列值排序的方法。
1.2 索引的作用
- 设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。
- 当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度.
- 可以降低数据库的IO成本,并且索引还可以降低数据库的排序成本。
- 通过创建唯一性索引,可以保证数据表中每一行数据的唯一性。通过创建唯一性索引,可以保证数据表中每一行数据的唯一性.
- 可以加快表与表之间的连接。可町以加快表与表之间的连接.
- 在使用分组和排序时,可大大减少分组和排序的时间。
- 建立索引在搜索和恢复数据库中的数据时能显著提高性能
总结: 索引的好处:提高数据查询速度,排序。
1.3 索引的副作用:
- 索引需要占用额外的磁盘空间。
对于mysql引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址。
- 在插入和修改数据时需要花费更多的时间,因为索引也要随之变动
1.4.创建索引的原则依据
索引虽可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。
- 表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位。
- 记录数超过300行的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能。
- 经常与其他表进行连接的表,在连接字段上应该建立索引。
- 唯一性太差的字段不适合建立索引。
- 更新太频繁地字段不适合创建索引。
- 经常与其他表进行连接的表,在连接字段上应该建立索引。
- 在经常进行GROUP BY、ORDER BY的字段上建立索引;
- 索引应该建在选择性高的字段上。
- 索引应该建在小字段上,对于大的文本甚至超长字段,不要建立索引。
二 索引的分类和创建
2.1 普通索引:
最基本的索引类型,没有唯一性之类的限制。
2.1.1 直接创建索引
CREATE INDEX 索引名 ON 表名 (列名[(length)]);
- (列名(length)):length(索引长度)是可选项,下同。如果忽略 length 的值,则使用整个列的值作为索引。如果指定使用列前的 length 个字符来创建索引,这样有利于减小索引文件的大小。
- 索引名建议以“_index”结尾。
查看表结构,并添加索引
2.1.2 修改表结构方式创建索引
ALTER TABLE 表名 ADD INDEX 索引名 (列名);
在创建完成索引后,可以使用select * from 表明 where 索引字段来查询索引字段,因为我们已经建立了该字段的索引,查询过程会加快响应速度
2.2.3 创建表的时候指定索引(不推荐)
2.2 唯一索引:(唯一键)
与普通索引类似,但区别是唯一索引的每个值都唯一。唯一索引允许有空值(注意和主键不同,唯一键可以有多个)。如果使用组合索引创建,则列值得组合必须唯一。添加唯一键将自动创建唯一索引。
2.2.1.直接创建唯一索引
CREATE UNIQUE INDEX 索引名 ON 表名(列名);
2.2.2 修改表方式创建唯一索引
ALTER TABLE 表名 ADD UNIQUE 索引名 (列名);
2.2.3 创建表的时候指定唯一索引
CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名));
2.3主建索引
是一种特殊的唯一索引,必须指定为“PRIMARYKEY"。一个表只能有一个主键,不允许有空值。添加主键将自动创建主键索引。
创建主键索引不能像创建唯一索引时使用
CREATE UNIQUE INDEX 索引名 ON 表名(列名)语法来创建了
2.3.1 创建表的时候指定主键索引
CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...], PRIMARY KEY (列名));
2.3.2 修改表方式创建主键索引
ALTER TABLE 表名 ADD PRIMARY key (列名);
2.4组合索引
可以是单列上创建的索到,也可以是在多列上创建的索引。需要满足最左原则,因为select语句的where 条件是依次从左往右执行的,所以在使用select 语句查询时 where条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。
2.4.1 创建表的时候指定组合索引
CREATE TABLE 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型,INDEX 索引名 (列名1,列名2,列名3));
2.4.2 修改表结构的方式创建索引
ALTER TABLE 表名 ADD INDEX 索引名 (列名1,列名2);
2..5全文索引(模糊查询)
适合在进行模糊查的时候使用可用于在一篇文章中检索文本信息。在MySQL5.6版本以前FULLTEXT 索引仅可用于MyISAM引擎,在5.6版本之后innodb引擎也支持FULLTEXT索引。全文索引可以在CHAR、VARCHAR或者TEXT类型的列上创建。每个表只允许有一个全文索引。
2.5.1 直接创建索引
ALTER TABLE 表名 ADD FULLTEXT 索引名 (列名);
2.5.2 创建表的时候指定全文索引
CREATE TABLE 表名 (字段1 数据类型[,...],FULLTEXT 索引名 (列名));
2.5.3 查找全文索引(模糊查询)
select * from 表名 where match(模糊查询字段) against ('想要查询的内容');
三. 查看表中有哪些索引
show index from 表名;或show index from 表明\G;
show keys from 表名;或show keys from 表名\G;
”show index from表名字’查询的字段含义
| 字段 | 含义 |
|---|---|
| Table | 表的名称 |
| Non_unique | 如果索引不能包括重复词,则为0;如果可以,则为1 |
| Key_name | 索引的名称 |
| seq_in_index | 索引中的列序号,从1开始 |
| column_name | 列名称 |
| collation | 列以什么方式存储在索引中。在 MySQL中,有值'A(升序)或 NULL(无分类) |
| Cardinality | 索引中唯一值数目的估计值 |
| sub_part | 如果列只是被部分地编入索引,则为被编入索引的字符的数目。如果整列被编入索引,则为NULL |
| Packed | 指示关键字如何被压缩。如果没有被压缩,则为NULL |
| Null | 如果列含有NULL,则含有YES。如果没有,则该列含有NO |
| lndex_type | 用过的索引方法(BTREE,FULLTEXT,HASH,RTREE) |
| comment | 备注 |
四. 删除索引
4.1 直接删除索引
DROP INDEX 索引名 ON 表名;
4.2 修改表格是删除索引
alter table 表名 drop index 索引名;
例:
alter table test drop index id_index;
4.3 删除主键索引
alter table 表名 drop primary key;
例:
alter table test drop primary key;
五 索引案例
场景 某商场做一个会员卡的系统。这个系统有一一个会员表,有下列字段 会员编号INT 会员姓名VARCHAR(10) 会员身份证号码VARCHAR(18) 会员电话INT(11) 会员住址VARCHAR(50) 会员备注信息TEXT
create table member (id int (10), name varchar(10), cardid varchar(10), phone int(11), addressvarchar(50),remark text);
alter table member add primary key (id);
create index name index on member (name);
create unique index cardid index on member (cardid);
alter table member add fulltext remark_index(remark);
表结构设计思路:
- 会员编号,作为主键,使用PRIMARY KEY
- 会员姓名,如果要建索引的话,可以为普通的INDEX
- 会员身份证号码,如果要建索引的话,可以选择UNIQUE(唯一的,不允许重复)
- 会员备注信息,如果需要建索引的话,可以选择FULLTEXT,全文搜索。
- 不过FULLTEXT用于搜索很长一篇文章的时候,效果最好。用在比较短的文本,如果就一两行字的,普通的INDEX也可以。
MySQL 事务
1.1 事务的概念
- 事务是一种机制、一个操作序列,包含了一组数据库操作命令,并且把所有的命令作为一个整体一起向系统提交或撤销操作请求,即这一组数据库命令要么都执行,要么都不执行。
- 事务是一个不可分割的工作逻辑单元,在数据库系统上执行并发操作时,事务是最小的控制单元。
- 事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等。
- 事务通过事务的整体性以保证数据的一致性。
总的来说,事务就是是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。
1.2 事务的ACID特点
ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)应该具有的四个特性:
- 原子性(Atomicity)
- 一致性(Consistency)
- 隔离性(Isolation)
- 持久性(Durability)
这是可靠数据库所应具备的几个特性。
1.2.1 原子性
指事务是一个不可再分割的工作单位,事务中的操作要么都发生,要么都不发生。
- 事务是一个完整的操作,事务的各元素是不可分的。
- 事务中的所有元素必须作为一个整体提交或回滚。
- 如果事务中的任何元素失败,则整个事务将失败。
1.2.2 一致性
指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏
- 当事务完成时,数据必须处于一致状态。
- 在事务开始前,数据库中存储的数据处于一致状态。
- 在正在进行的事务中,数据可能处于不一致的状态。
- 当事务成功完成时,数据必须再次回到已知的一致状态。
1.2.3 隔离性
指在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间。
- 对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应以任何方式依赖于或影响其他事务。
- 修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据。
事务之间的相互影响分为几种,分别为
(1)脏读:一个事务读取了另一个事务未提交的数据,而这个数据是有可能回滚的。
(2)不可重复读:一个事务内两个相同的查询却返回了不同数据。这是由于查询时系统中其他事务修改的提交而引起的。
(3)幻读:一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。同时,另一个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。那么,操作前一个事务的用户会发现表中还有没有修改的数据行,就好象发生了幻觉一样。
(4)丢失更新:两个事务同时读取同一条记录,A先修改记录,B也修改记录(B不知道A修改过),B提交数据后B的修改结果覆盖了A的修改结果。
1.3 Mysql 事务及事物隔离级别
//事务的隔离级别决定了事务之间可见的级别 MySQL事务支持如下四种隔离,用以控制事务所做的修改,并将修改通告至其它并发的事务:
- 未提交读(Read Uncommitted(RU): 允许脏读,即允许一个事务可以看到其他事务未提交的修改。
- 提交读(Read Committed(RC): 允许一个事务只能看到其他事务已经提交的修改,未提交的修改是不可见的。防止脏读。
- 可重复读(Repeated Read(RR):---mysq1默认的隔离级别 确保如果在一个事务中执行两次相同的SELECT语句,都能得到相同的结果,不管其他事务是否提交这些修改。可以防止脏读和不可重复读
- 串行读(Serializable):---相当于锁表 完全串行化的读,将一个事务与其他事务完全地隔离。每次读都需要获得表级共享锁,读写相互都会阻塞。可以防止脏读,不可重复读取 和幻读,(事务串行化)会降低数据库的效率。
mysql默认的事务处理级别是 repeatable read ,而Oracle和SQL Server是 read committed 。
查询全局事务隔离级别
查询会话事务隔离级别
#查询会话事务隔离级别的三种方法
show session variables like '%isolation%';
SELECT @@session.tx_isolation;
SELECT @@tx_isolation;
设置全局事务隔离级别
set global transaction isolation level 级别;
设置当前会话事务隔离级别
set session transaction isolation level 级别;
1.4 持久性
在事务完成以后,该事务所对数据库所作的更改便持久的保存在数据库之中,并不会被回滚。
- 指不管系统是否发生故障,事务处理的结果都是永久的。
- 一旦事务被提交,事务的效果会被永久地保留在数据库中。
小结
- 在事务管理中,原子性是基础,隔离性是手段,一致性是目的,持久性是结果。
事务控制语句
- BEGIN 或 START TRANSACTION:显式地开启一个事务。
- COMMIT 或 COMMIT WORK:提交事务,并使已对数据库进行的所有修改变为永久性的。
- ROLLBACK 或 ROLLBACK WORK:回滚会结束用户的事务,并撤销正在进行的所有未提交的修改。
- SAVEPOINT S1:使用 SAVEPOINT 允许在事务中创建一个回滚点,一个事务中可以有多个 SAVEPOINT;“S1”代表回滚点名称。
- ROLLBACK TO [SAVEPOINT] S1:把事务回滚到标记点。
测试begin和commit(开始事务和提交事务)
打开另外一个会话
此时会话1提交事务
会话2查看数据变化
测试事务未提交的回滚
测事务的回滚功能,注意,现在我还没有提交事务哦
测试创建回滚点并进行回滚
回滚到刚刚创建的保存点s1
事务未COMMIT可以回滚,COMMIT之后不可以回滚。
使用 set 设置控制事务
自动提交关闭状态(初始状态)
#禁止自动提交(状态为OFF)
SET AUTOCOMMIT=0;
开启事务自动提交
#开启自动提交,Mysql默认为1(状态为ON)
SET AUTOCOMMIT=1;
开启事务自动提交
修改数据
尝试rollback回滚
查看控制事务
#查看Mysql中的AUTOCOMMIT值
show variables like 'autocommit';
#对取值的说明:
值为 0 和值为OFF:关闭事务自动提交。如果关闭自动提交,用户将会一直处于某个事务中,只有提交或回滚后才会结束当前事务,重新开始一个新事务。
值为 1 和值为 ON:开启事务自动提交。如果开启自动提交,则每执行一条 SQL 语句,事务都会提交一次。
总结
关闭自动提交后,该位置会作为一个事务起点,直到执行 COMMIT 语句和 ROLLBACK 语句后,该事务才结束。结束之后,这就是下一个事务的起点。
关闭自动提交功能后,只用当执行 COMMIT 命令后,MySQL 才将数据表中的资料提交到数据库中。如果执行 ROLLBACK 命令,数据将会被回滚。如果不提交事务,而终止 MySQL 会话,数据库将会自动执行回滚操作。
使用 BEGIN 或 START TRANSACTION 开启一个事务之后,自动提交将保持禁用状态,直到使用 COMMIT 或 ROLLBACK 结束事务。之后,自动提交模式会恢复到之前的状态,即如果 BEGIN 前 autocommit = 1,则完成本次事务后 autocommit 还是 1。如果 BEGIN 前 autocommit = 0,则完成本次事务后 autocommit 还是 0。
MySQL存储引擎
存储引擎概述
-
MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎
-
存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式
-
MySQL常用的存储引擎
- MyISAM
- InnoDB
-
MySQL数据库中的组件,负责执行实际的数据I/O操作
-
MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储
MyISAM的特点介绍
-
MyISAM不支持事务,也不支持外键约束,只支持全文索引,数据文件和索引文件是分开保存的口访问速度快,对事务完整性没有要求
-
MyISAM 适合查询、插入为主的应用
-
MyISAM在磁盘上存储成三个文件,文件名和表名都相同,但是扩展名分别为:
- .frm文件存储表结构的定义
- 数据文件的扩展名为MYD(MYData)
- 索引文件的扩展名是MYI(MYIndex)
-
表级锁定形式,数据在更新时锁定整个表
-
数据库在读写过程中相互阻塞
-
会在数据写入的过程阻塞用户数据的读取
-
也会在数据读取的过程中阻塞用户的数据写入口数据单独写入或读取,速度过程较快且占用资源相对少
-
MyIAM支持的存储格式
- 静态表
- 动态表
- 压缩表
静态(固定长度)表
- 静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多。
动态表
- 动态表包含可变字段,记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行OPTIMIZE TABLE 语句或myisamchk-r命令来改善性能,并且出现故障的时候恢复相对比较困难。
压缩表
- 压缩表由myisamchk工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支。
MyISAM适用的生产场景
- 公司业务不需要事务的支持
- 单方面读取或写入数据比较多的业务
- MyISAM存储引擎数据读写都比较频繁场景不适合
- 使用读写并发访问相对较低的业务
- 数据修改相对较少的业务
- 对数据业务一致性要求不是非常高的业务
- 服务器硬件资源相对比较差
InnoDB特点介绍
-
支持事务,支持4个事务隔离级别
-
MySQL从5.5.5版本开始,默认的存储引擎为lnnoDB读写阻塞与事务隔离级别相关
-
能非常高效的缓存索引和数据
-
表与主键以簇的方式存储
-
支持分区、表空间,类似oracle数据库
-
支持外键约束,5.5前不支持全文索引,5.5后支持全文索引
-
对硬件资源要求还是比较高的场合
-
行级锁定,但是全表扫描仍然会是表级锁定,如:
- update table set a=1 where user like"%zhang%';
-
InnoDB中不保存表的行数,如 select count(*)from table;时,InnoDB 需要扫描一遍整个表来计算有多少行,但是MyISAM只要简单的读出保存好的行数即可。需要注意的是,当count()语句包含where条件时MyISAM 也需要扫描整个表
-
对于自增长的字段,InnoDB中必须包含只有该字段的索引,但是在MyISAM表中可以和其他字段一起建立组合索引
-
清空整个表时,lnnoDB是一行一行的删除,效率非常慢。
InnoDB适用生产场景
-
业务需要事务的支持
-
行级锁定对高并发有很好的适应能力,但需确保查询是通过索引来完成
-
业务数据更新较为频繁的场景
- 如:论坛,微博等
-
业务数据一致性要求较高
- 如:银行业务
-
硬件设备内存较大,利用InnoDB较好的缓存能力来提高内存利用率,减少磁盘IO的压力
InnoDB与MyISAM 区别
- MyISAM:不支持事务和外键约束,占用空间较小,访问速度快,表级锁定,适用于不需要事务处理,单独写入或查询的应用场景。
- rnnopB:支持事务处理、外键约束、占用空间比MyISAM大,支持行级锁定,读写并发能力较好,适用于一致性要求高、数据更新频繁的应用场景。
企业选择存储引擎
-
需要考虑每个存储引擎提供了哪些不同的核心功能及应用场景
-
支持的字段和数据类型
- 所有引擎都支持通用的数据类型
- 但不是所有的引擎都支持其它的字段类型,如二进制对象
-
锁定类型:不同的存储引擎支持不同级别的锁定
- 表锁定:MyISAM支持
- 行锁定:InnoDB支持
-
索引的支持
- 建立索引在搜索和恢复数据库中的数据时能显著提高性能
- 不同的存储引擎提供不同的制作索引的技术
- 有些存储引擎根本不支持索引
-
事务处理的支持
- 提高在向表中更新和插入信息期间的可靠性
- 可根据企业业务是否要支持事务选择存储引擎
控制语句
查看系统支持的存储引擎
show engines;
查看表使用的存储引擎
方法一:
show table status from 库名 where name='表名'\G;
方法二:
use 库名;
show create table表名;
修改存储引擎
1.通过alter table修改
use 库名;
alter table 表名 engine=MyISAM;
2.通过修改/etc/my.cnf 配置文件,指定默认存储引擎并重启服务
vim/etc/my.cnf
[mysqld]
default-storage-engine=myisam
systemctl restart mysql.service
注意:此方法只对修改了配置文件并重启mysq1服务后新创建的表有效,已经存在的表不会有变更。
3.通过create table创建表时指定存储引擎
use库名;
create table 表名(字段1数据类型,...)engine=MyISAM;
InnoDB行锁与索引的关系
- InnoDB行锁是通过给索引项加锁来实现的,如果没有索引,InnoDB将通过隐藏的聚簇索引来对记录加锁。
selete frim t1 where id=1;
- 如果id字段是主键,innodb对于主键使用了聚簇索引,会直接锁住整行记录。
delete from tl where name='aaa';
- 如果name字段是普通索引,会先锁住索引的两行,接着会锁住相应主键对应的记录。
delete from t1 where age=23;
- 如果age字段没有索引,会使用全表扫描过滤,这时表上的各个记录都将加上锁。
死锁 死锁一般是事务相互等待对方资源,最后形成环路造成的。 案例:
create table t1(id int primary key,name char(4),age int);
insert into t1 values(1,'aaa',22);
insert into t1 values(2,'bbb',23);
insert into t1 values(3,'aaa',24);
insert into t1 values(4,'bbb',25);
insert into t1 values(5,'ccc',26);
insert into t1 values(6,'zzz',27);
会话1
begin;
delete from tl where id=5;
会话2
begin;
select * from t1 where id=1 for update;
会话1
delete from tl where id=1;#死锁发生
会话2
update t1 set name='abc' where id=5; #死锁发生
注:for update可以为数据库中的行上一个排它锁。当一个事务的操作未完成时候,其他事务可以读取但是不能写入或更新。
总结
如何尽可能避免死锁?
- 使用更合理的业务逻辑,以固定的顺序访问表和行。
- 大事务拆小。大事务更倾向于死锁,如果业务允许,将大事务拆小。
- 在同一个事务中,尽可能做到一次锁定所需要的所有资源,减少死锁概率。
- 降低隔离级别。如果业务允许,将隔离级别调低也是较好的选择,比如将隔离级别从R调整为RC,可以避免掉很多因为gap锁造成的死锁。
- 为表添加合理的索引。如果不使用索引将会为表的每一行记录添加上锁,死锁的概率大大增大。