面试题
你们有没有做过MySQL读写分离?如何实现MySQL的读写分离?MySQL主从复制原理的是啥?如何解决MySQL主从同时的延时问题?
面试官心里分析
这个,高并发这个阶段,那肯定是需要做读写分离的,啥意思?因为实际上大部分的互联网公司,一些网站,或者是app,其实是读多写少。所以针对这个情况,就是写一个主库,但是主库挂了多个从库,然后从多个从库来读,那不就可以支撑更高的读并发压力了吗?
面试题剖析
(1)如何实现MySQL的读写分离
其实很简单,就是基于主从复制架构,简单来说,就搞一个主库,挂多个从库,然后我们就单单只是写主库,然后主库自动把数据给同步到从库上去。
(2)MySQL主从复制原理的是啥?
MySQL里有一个概念,叫做binlog日志,就是每个增删改类的操作,会改变数据的操作,除了更新数据意外,这个增删改操作还会写入一个日志文件,记录这个操作的日志,这个日志就叫做binlog日志
先简单看看图
- 主库将变更写入binlog日志,然后从库连接到主库之后,从库有一个IO线程,将主库的binlog日志拷贝到自己本地,写入一个中继日志中。接着从库中有一个SQL线程会从中继日志读取binlog,然后执行binlog日志中的内容,也就是在自己本地再次执行一遍SQL,这样就可以保证自己跟主库的数据是一样的。
- 这里有非常重要的一点,就是从库同步主库数据的过程是串行化的,也就是说主库上并行的操作,在从库上会串行执行。所以这就是一个非常重要的点了,由于从库从主库拷贝日志以及串行执行SQL的特点,在高并发场景下,从库的数据一定会比主库慢一些,是有延时的,所以经常出现,刚写入主库的数据可能是读不到的,要过几十毫秒,甚至几百毫秒才能读取到。
- 而且这里还有另外一个问题,就是如果主库突然宕机,然后恰好数据还没同步到从库,那么有些数据可能在从库上是没有的,有些数据可能就丢失了。
- 所以mysql实际上在这一块有两个机制,一个是半同步复制,用来解决主库数据丢失问题,一个是并行复制,用来解决主从同步延时问题,
- 这个所谓半同步复制,指的就是主库写入binlog日志之后,就会将强制此时立即将数据同步到从库,从库将日志写入自己本地的relay log(中继日志)之后,接着会返回一个ack给主库,主库接收到至少一个从库的ack之后才会认为写操作完成了。
- 所谓的并行复制,指的是从库开启多个线程,并行读取relay log中不同库的日志,然后进行重放不同库的日志,这是库级别的并行
mysql主从同步延时问题(精华)
- 分库,将一个主库拆分为4个主库,每个主库的写并发就500/s,此时主从延迟可以忽略不计
- 打开mysql支持的并行复制,多个库并行复制,如果说某个库的写入并发就是特别高,单库写并发达到2000/s,并行复制还是没有意义,28法则,很多时候比如说,就是少数的几个订单表,写入了2000/s,其他几十个表10/s
- 重写代码,写代码的同学,要慎重,插入数据之后,直接就更新,不用查询
- 如果确实是存在必须先插入,立马要求就查询到,然后立马就要反过来执行一些操作,对这个查询设置直连主库,不推荐这种方法,你这么搞导致读写分离的意义就没有了