一.主从复制简介
复制是 MySQL 的一项功能,允许服务器将更改从一个实例复制到另一个实例。
①主服务器将所有数据和结构更改记录到二进制日志中。
②从属服务器从主服务器请求该二进制日志并在本地应用其内容。
③IO:请求主库,获取上一次执行过的新的事件,并存放到relaylog
④SQL:从relaylog中将sql语句翻译给从库执行
二.主从复制原理
1.主从复制的前提
①两台或两台以上的数据库实例
②主库要开启二进制日志
③主库要有复制用户
④主库的server_id和从库不同
⑤从库需要在开启复制功能前,要获取到主库之前的数据(主库备份,并且记录binlog当时位置)
⑥从库在第一次开启主从复制时,时必须获知主库:ip,port,user,password,logfile,pos
⑦从库要开启相关线程:IO、SQL
⑧从库需要记录复制相关用户信息,还应该记录到上次已经从主库请求到哪个二进制日志
⑨从库请求过来的binlog,首先要存下来,并且执行binlog,执行过的信息保存下来
2.主从复制涉及到的文件和线程
主库:
①主库binlog:记录主库发生过的修改事件
②dump thread:给从库传送(TP)二进制日志线程
从库:
①relay-log(中继日志):存储所有主库TP过来的binlog事件
②master.info:存储复制用户信息,上次请求到的主库binlog位置点
③IO thread:接收主库发来的binlog日志,也是从库请求主库的线程
④SQL thread:执行主库TP过来的日志
主从复制原理图
大前提条件:做主从复制之前,一定要保证主库和从库之间数据一致性
①通过change master to语句告诉从库主库的ip,port,user,password,file,pos
②从库通过start slave命令开启复制必要的IO线程和SQL线程
③从库通过IO线程拿着change master to用户密码相关信息,连接主库,验证合法性
④从库连接成功后,会根据binlog的pos问主库,有没有比这个更新的
⑤主库接收到从库请求后,比较一下binlog信息,如果有就将最新数据通过dump线程给从库IO线程
⑥从库通过IO线程接收到主库发来的binlog事件,存储到TCP/IP缓存中,并返回ACK更新
⑦将TCP/IP缓存中的内容存到relay-log中
⑧SQL线程读取relay-log.info,读取到上次已经执行过的relay-log位置点,继续执行后续的relay-log日志,执行完成后,更新http://relay-log.…
三、主从复制搭建实战
主库操作:
1)修改配置文件
#编辑mysql配置文件
[root@db01 ~]# vim /etc/my.cnf
#在mysqld标签下配置
[mysqld]
#主库server-id为1,从库不等于1
server_id =1
#开启binlog日志
log_bin=mysql-bin
2)创建主从复制用户
#登录数据库
[root@db01 ~]# mysql -uroot -poldboy123
#创建rep用户
mysql> grant replication slave on *.* to rep@'10.0.0.%' identified by '123';
从库操作:
1)修改配置文件
#修改db02配置文件
[root@db02 ~]# vim /etc/my.cnf
#在mysqld标签下配置
[mysqld]
#主库server-id为1,从库不等于1, 但从库之间的server_id可以相等
server_id =5
#重启mysql
[root@db02 ~]# /etc/init.d/mysqld restart
#记录主库binlog及位置点
[root@db01 ~]# mysql -uroot -poldboy123
mysql> show master status;
| mysql-bin.000002 | 317
#登陆数据库
[root@db02 ~]# mysql -uroot -poldboy123
#执行change master to 语句
mysql> change master to
-> master_host='10.0.0.51',
-> master_user='rep',
-> master_password='123',
-> master_log_file='mysql-bin.000002',
-> master_log_pos=317,
-> master_port=3306;
mysql> start slave;
mysql> show slave status\G
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
四.主从复制基本故障处理
IO线程报错解决思路
# IO线程报错:
解决思路:
1.网络
[root@db02 ~]# ping 10.0.0.51
1)硬件层,路由,交换机,网络设备
2)网线
3)安全组规则
4)插错网线口
2.端口
[root@db02 ~]# telnet 10.0.0.51 3306
#关闭防火墙
systemctl stop firewalld
#防火墙添加允许mysql端口
firewalld-cmd --add-service=mysql
firewalld-cmd --add-port=3306/tcp
3.用户名
mysql> grant replication slave on *.* to rep@'%' identified by '123';
4.密码,先登录测试
[root@db03 data]# mysql -urep -p123 -h10.0.0.51
如果报错 #rep@'db03',需在参数,跳过反向解析
vim /etc/my.cnf
skip_name_resolve
#搭建主从时,用户名、密码、主机域、端口一定要一致。
change master to
master_host='10.0.0.51',#1
master_user='rep',#2
master_password='123',#3
master_log_file='mysql-bin.000003',
master_log_pos=169853,
master_port=3306;
SQL线程报错
处理方法一:
#临时停止同步
mysql> stop slave;
#将同步指针向下移动一个(可重复操作)
mysql> set global sql_slave_skip_counter=1;
#开启同步
mysql> start slave;
处理方法二:
#编辑配置文件
[root@db01 ~]# vim /etc/my.cnf
#在[mysqld]标签下添加以下参数,把线程号添加到配置文件
slave-skip-errors=1032,1062,1007
但是方法一、方法二都是有风险存在的,只是跳过错误,不能从根本上解决问题
处理方法三:
1)重新备份数据库,恢复到从库
2)给从库设置为只读
#在命令行临时设置
set global read_only=1;
#在配置文件中永久生效
read_only=1
注意:登录用户如果是all权限,包含了super超级权限,还是可以进行操作的
- all 权限,即使配置文件设置了只读,还是都可以操作的。
- 不加all权限。哪怕给他指定select,insert, delete ,create 权限,都是不能操作,只能只读的。
例如:
#设置配置文件永久生效
[root@db03 ~]# vim /etc/my.cnf
read_only=1
#重启
[root@db03 ~]# /etc/init.d/mysqld restart
Shutting down MySQL.. SUCCESS!
Starting MySQL. SUCCESS!
#查看
mysql> show variables like 'read_only';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| read_only | ON |
+---------------+-------+
1 row in set (0.00 sec)
1. all 权限
[root@db03 ~]# mysql
mysql> grant all on *.* to rea@'%' identified by '123';
Query OK, 0 rows affected (0.00 sec)
[root@db03 ~]# mysql -urea -p123 -h 10.0.0.53
mysql> create database aaa;
Query OK, 1 row affected (0.01 sec)
2.不是all权限
mysql> grant select,create,delete,insert on *.* to rea1@'%' identified by '123';
Query OK, 0 rows affected (0.00 sec)
[root@db03 ~]# mysql -urea1 -p123 -h10.0.0.53
mysql> create database bbb;
ERROR 1290 (HY000): The MySQL server is running with the --read-only option so it cannot execute this statement
mysql> drop database test;
ERROR 1290 (HY000): The MySQL server is running with the --read-only option so it cannot execute this statement
...
五.延时从库
普通的主从复制可能存在不足
- 逻辑损坏怎么办?
- 不能保证主库的操作,从库一定能做
- 高可用?自动failover?
- 过滤复制
企业中一般会延时3-6小时
延时从库配置方法
#停止主从
mysql>stop slave;
#设置延时为180秒
mysql> change master to master_delay= 180;
#开启主从
mysql>start slave;
#查看状态
mysql> show slave status\G
SQL_Delay: 60
#或者做主从的时候直接指定延时
change master to
master_host='10.0.0.51',
...
master_delay=3600;
3.延时从库停止方法
#停止主从
mysql> stop slave;
#设置延时为0
mysql> change master to master_delay = 0;
#开启主从
mysql> start slave;
企业案例:
总数据量级500G,正常备份去恢复需要1.5-2小时
1)配置延时3600秒
mysql>change master to master_delay = 3600;
2)主库
drop database db;
3)怎么利用延时从库,恢复数据?
提示:
- 从库relaylog存放在datadir目录下
- mysqlbinlog 可以截取relaylog内容
- show relay log events in 'db01-relay-bin.000001';
处理的思路:
①停止SQL线程
②截取relaylog到误删除之前点
- relay-log.info 获取到上次运行到的位置点,作为恢复起点
- 分析relay-log的文件内容,获取到误删除之前position
模拟故障处:
- 关闭sql
- 模拟数据
- 开启从库延时3600s
- 破坏,模拟删库故障。(以下步骤在5分钟内操作完成。)
- 从库,关闭SQL线程
- 截取relay-log
恢复relay.sql
- 取消从库身份,恢复数据,从库当主库
- 从库导出来的数据传给主库,恢复数据
模拟环境
-
主库
#一直写数据 [root@db01 ~]# sh mysqldump.sh #全备 [root@db01 ~]# mysqldump -uroot -p1 -A --triggers -R --master-data=2 --single-transaction |gzip >/backup/full.gz Warning: Using a password on the command line interface can be insecure. #查看 [root@db01 ~]# ll /backup/ total 376 -rw-r--r-- 1 root root 384381 Nov 17 09:22 full.gz #查看mysql-bin和起点 [root@db01 ~]# zcat /backup/full.gz |head -25 -- CHANGE MASTER TO MASTER_LOG_FILE='mysql-bin.000001', MASTER_LOG_POS=517;
#scp到对端 [root@db01 ~]# scp /backup/dbdb.sql 172.16.1.54:/tmp [root@db01 ~]# mysql -uroot -p1 mysql> grant replication slave on . to rep@'%' identified by '123';
-
从库
#准备初始化环境 [root@db04 ~]# /etc/init.d/mysqld stop [root@db04 ~]# rm -fr /application/mysql/data/* [root@db04 ~]# ./mysql_install_db --user=mysql --basedir=/opt/mysql --datadir=/opt/mysql/data/ [root@db04 ~]# /etc/init.d/mysqld start
#导库 [root@db04 ~]# zcat /tmp/dbdb.sql |mysql #主从 [root@db04 ~]# mysql -uroot -p1 mysql> change master to master_host='10.0.0.51', master_user='db', master_password='123', master_log_file='mysql-bin.000001', master_log_pos=517, master_port=3306,
master_delay=3600; -
主库模拟删库故障
[root@db01 ~]# mysql -uroot -p1 mysql> select count() from db1.t1; +----------+ | count() | +----------+ | 888 | +----------+ 1 row in set (0.00 sec)
mysql> drop database db1; Query OK, 1 row affected (0.02 sec)
-
从库先关闭sql线程
[root@db04 ~]# mysql SQL_Delay: 3600
mysql> select count() from db1.t1; +----------+ | count() | +----------+ | 655 | +----------+ 1 row in set (0.00 sec)
mysql> stop slave sql_thread; Query OK, 0 rows affected (0.01 sec) Slave_IO_Running: Yes Slave_SQL_Running: No
-
从库将误删除的主库导出拷贝到主库
[root@db04 data]# mysqldump -B db1>/tmp/db_quan.sql [root@db04 data]# scp /tmp/db_quan.sql 172.16.1.51:/backup/
-
截取未同步的数据到删库之前的操作.
#获取起点 [root@db04 data]# cat relay-log.info 7 ./db04-relay-bin.000002 283 mysql-bin.000003 44040 3600 0 1
#获取终点 方法一: [root@db04 data]# mysql #查看relaylog事件 mysql> show relaylog events in 'db04-relay-bin.000002'; | db04-relay-bin.000002 | 45118 | Query | 1 | 161795 | drop database db1
#或者在命令行执行 [root@db04 ~]# mysql -e "show relaylog events in 'db04-relay-bin.000002'";#方法二: [root@db04 data]# mysqlbinlog -d db1 --base64-output=decode-rows -vvv db04-relay-bin.000002 |grep -i -B 5 'drop database' #191117 13:38:56 server id 1 end_log_pos 88875 CRC32 0xcfd701dd Xid = 15750 COMMIT/!/;
at 45118
#191117 13:38:58 server id 1 end_log_pos 88964 CRC32 0x905241e7 Query thread_id=2671 exec_time=0 error_code=0 SET TIMESTAMP=1573969138/!/; drop database db1
#截取这段数据导出并发送给主库 [root@db04 data]# mysqlbinlog --start-position=283 --stop-position=45118 /opt/mysql/data/db04-relay-bin.000002 >/tmp/db_zeng.sql [root@db04 data]# scp /tmp/db_zeng.sql 172.16.1.51:/backup/
-
主库将两段内容导入并查看数据完整性
[root@db01 data]# mysql -uroot -p1 </backup/db_quan.sql [root@db01 data]# mysql -uroot -p1 </backup/db_zeng.sql mysql> select count() from db1.t1; +----------+ | count() | +----------+ | 900 | +----------+ 1 row in set (0.00 sec)
-
从库开启sql线程 将延时关闭查看是否同步
[root@db04 data]# mysql mysql> start slave sql_thread; mysql> stop slave; mysql> change master to master_delay=0; mysql> start slave; #查看 mysql> select count() from db1.t1; +----------+ | count() | +----------+ | 900 | +----------+ 1 row in set (0.00 sec)
-
再次开启延时
mysql> stop slave; mysql> change master to master_delay=3600; mysql> start slave; Query OK, 0 rows affected (0.01 sec)