MySQL逻辑备份的过程及相关重要参数说明

140 阅读5分钟
原文链接: click.aliyun.com

一、重要参数

逻辑备份常用的命令就是MySQL自带的mysqldump命令,这个命令要着重关注下面的几个关键参数:
--single-transaction:
该参数只对innodb表起作用,作用是保证备份出来的innodb表数据是一致性的。具体的实现原理是:将当前会话的事务隔离级别设置为RR级别,这样保证在一个事务中读取到一致性数据;然后显示地开启一个事务,也就是dump线程会执行“start transaction”命令。这样在这个事务期间,查询并导出所有innodb表数据,就可以保证导出的数据的一致性,这也就是为什么逻辑备份的恢复起点是备份的开始时刻。
--master-data:
该参数的作用就是记录逻辑备份开始时的binlog位置(也就是恢复的起点)。具体实现的方式是:这个参数会打开--lock-all-tables参数,这时dump线程就会执行“flush tabls with read lock”,锁住数据库中所有表;然后再执行“show master status”命令导出binlog位置信息,以达到记录binlog位置的目的。至于FTWRL锁什么时候释放?如果同时指定了--single-transaction参数的话,在记录完binlog位置后就会释放,所以持有FTWRL锁的时间很短;但如果没有指定single-transaction参数,那么会锁定到备份结束。这个选项会自动关闭–lock-tables
--lock-all-tables:
该参数的作用是给数据库中的所有库的所有表都加上FTWRL锁(非innodb和innodb表都加锁),一次性加锁,直到备份结束后释放锁。所以这个参数一开启的话,整个系统都不能写入。并且这个参数和--single-transaction是冲突的,只能二选其一。
--lock-tables:
该参数表示锁定某个库的所有表。如果你只是备份一个库,例如备份test库,就可以使用--lock-tables来锁定test库的所有表,而其它库的表并不会被锁定。该参数与--lock-all-tables的不同就是其锁定的范围小,所以能使用--lock-tables就不使用--lock-all-tables,特别是只备份部分库的情况下。在备份时,该参数是一次性锁定指定库的所有表,并不是锁定当前导出表(这个可以参考博客:
www.cnblogs.com/kerrycode/p…

二、mysqldump备份过程

通常进行逻辑备份时,我们都会使用“--single-transaction”+“--master-data”的参数组合。那么这个备份过程是怎样的呢?
备份过程可以分为下面几大步:
1、执行FTWRL,全局禁止读写
一般数据库的读写都很频繁的,不全局锁表的话后面是没法记录备份开始时的binlog位置的。
2、开启快照读
FTWRL锁加完后,dump线程就在会话级别上设置隔离级别为RR,然后显式地开启一个事务:START TRANSACTION /*!40100 WITH CONSISTENT SNAPSHOT 。
3、获取binlog信息
然后就是执行show master status命令。记录下binlog位置。
4、释放FTWRL锁
记录完binlog信息后,立即释放锁(执行“unlock tables”),这样可以保证其它业务对表进行正常读写了。
5、备份innodb表数据
逐一地备份表数据,通过innodb的MVCC特性来达到备份时的innodb表数据一致性,直接在事务内执行“select * from tb_name”语句获取表数据;如果系统中还有myisam表的话,则会以同样的方式备份myisam表,但备份出来myisam表数据并不一致。至此备份过程结束。

三、逻辑备份相关问题说明

1、--single-transaction和--lock-all-tables为什么冲突
--single-transaction参数会开启一个事务,然后在该事务内通过select语句备份表数据;而--lock-all-tables参数在执行lock tables时会隐式提交所有pending事务,这会影响到--single-transaction参数,所以不能共用。
2、库中既有innodb表又有myisam表,该如何保证备份数据一致性
这是逻辑备份绕不开的一个话题:如果备份表只有innodb表,那么通过--single-transaction就可以保证数据一致性;如果备份表只有myisam表,那么只能通过--lock-all-tables或者--lock-tables参数锁表来达到数据一致性。
如果待备份的库基本都是innodb表,但含有少量myisam表,为了保证最大的并发性,可这样实施:
先只备份innodb表,通过--ignore-table参数忽略myisam表;
再单独备份myisam表,通过参数--tables指定myisam表;
这时两个备份的时间点是不一致的,第一个备份比第二个备份时间点要早,可以先将第一个备份通过跑binlog跑到第二个备份的时间点来达到一致性
以上方式可最大限度提高并发性,但实施较复杂,如果希望快速备份,那么就直接--lock-all-talbes锁定全表备份。
3、为什么逻辑备份这么慢
逻辑备份一般只适合小容量的备份。可以从逻辑备份的实际过程来看,以innodb表备份为例,mysql是在开启的事务内通过执行“select * from tb_name”的方式来备份数据的,如果该表是一张千万级别乃至亿级别的大表,如果有很多这样的大表......所以对于大数据量的备份基本采用物理备份。