面试题

你们有没有做过MySQL读写分离？如何实现MySQL的读写分离？MySQL主从复制原理的是啥？如何解决MySQL主从同时的延时问题？

面试官心里分析

这个，高并发这个阶段，那肯定是需要做读写分离的，啥意思？因为实际上大部分的互联网公司，一些网站，或者是app，其实是读多写少。所以针对这个情况，就是写一个主库，但是主库挂了多个从库，然后从多个从库来读，那不就可以支撑更高的读并发压力了吗？

面试题剖析

（1）如何实现MySQL的读写分离

其实很简单，就是基于主从复制架构，简单来说，就搞一个主库，挂多个从库，然后我们就单单只是写主库，然后主库自动把数据给同步到从库上去。

（2）MySQL主从复制原理的是啥？

MySQL里有一个概念，叫做binlog日志，就是每个增删改类的操作，会改变数据的操作，除了更新数据意外，这个增删改操作还会写入一个日志文件，记录这个操作的日志，这个日志就叫做binlog日志

先简单看看图

主库将变更写入binlog日志，然后从库连接到主库之后，从库有一个IO线程，将主库的binlog日志拷贝到自己本地，写入一个中继日志中。接着从库中有一个SQL线程会从中继日志读取binlog，然后执行binlog日志中的内容，也就是在自己本地再次执行一遍SQL，这样就可以保证自己跟主库的数据是一样的。
这里有非常重要的一点，就是从库同步主库数据的过程是串行化的，也就是说主库上并行的操作，在从库上会串行执行。所以这就是一个非常重要的点了，由于从库从主库拷贝日志以及串行执行SQL的特点，在高并发场景下，从库的数据一定会比主库慢一些，是有延时的，所以经常出现，刚写入主库的数据可能是读不到的，要过几十毫秒，甚至几百毫秒才能读取到。
而且这里还有另外一个问题，就是如果主库突然宕机，然后恰好数据还没同步到从库，那么有些数据可能在从库上是没有的，有些数据可能就丢失了。
所以mysql实际上在这一块有两个机制，一个是半同步复制，用来解决主库数据丢失问题，一个是并行复制，用来解决主从同步延时问题，
这个所谓半同步复制，指的就是主库写入binlog日志之后，就会将强制此时立即将数据同步到从库，从库将日志写入自己本地的relay log（中继日志）之后，接着会返回一个ack给主库，主库接收到至少一个从库的ack之后才会认为写操作完成了。
所谓的并行复制，指的是从库开启多个线程，并行读取relay log中不同库的日志，然后进行重放不同库的日志，这是库级别的并行

mysql主从同步延时问题（精华）

分库，将一个主库拆分为4个主库，每个主库的写并发就500/s，此时主从延迟可以忽略不计
打开mysql支持的并行复制，多个库并行复制，如果说某个库的写入并发就是特别高，单库写并发达到2000/s，并行复制还是没有意义，28法则，很多时候比如说，就是少数的几个订单表，写入了2000/s，其他几十个表10/s
重写代码，写代码的同学，要慎重，插入数据之后，直接就更新，不用查询
如果确实是存在必须先插入，立马要求就查询到，然后立马就要反过来执行一些操作，对这个查询设置直连主库，不推荐这种方法，你这么搞导致读写分离的意义就没有了

说说MySQL读写分离的原理？主从同步延时咋解决？

面试题

面试官心里分析

面试题剖析

（1）如何实现MySQL的读写分离

（2）MySQL主从复制原理的是啥？

mysql主从同步延时问题（精华）