MySQL高级第十七篇:数据库主从复制原理及保证数据一致性
- 一、概述
- 1. 提升数据库的并发能力
- 2. 主从复制的作用?
- 二、主从复制原理
- 三、搭建一主一从环境
- 四、如何解决数据一致性问题?
- 1. 方案一、异步复制
- 2. 方案二、半同步复制
- 3. 方案三、组复制
一、概述
1. 提升数据库的并发能力
- 在实际工作中,我们常常将Redis作为缓存与MySQL来配合使用,当有请求的时候,首先会从缓存中进行查
找,如果存在就直接取出,如果不存在再访问数据库。 - 这样就提升了读取的效率,也减少了对后端数据库的访问压力。
- 此外,对于一般数据库应用而言,都是读多写少的,当数据库读取数据压力较大时,我们可以从成本较小的方案开始优化,
可以首先考虑优化SQL和索引,其次就是缓存策略,最后才是主从架构
。
2. 主从复制的作用?
- 第一:
读写分离
- 在读多写少的情况下,可以采用读写分离,主库当做写库,然后根据实际需要,选择使用多个读库,分散读的压力,提高并发性。
- 第二:
数据备份
- 主从复制其实就相当于一种热备份的机制。
- 第三:
实现高可用
- 数据备份其实就是一种冗余机制,当主服务器出现故障是时,可以切换到从服务器上,提高服务器可用性。
二、主从复制原理
- 实际上主从同步的原理就是基于binlog进行数据同步的。在主从复制过程中,会基于
3个线程
来操作,一个主库线程,两个从库线程。 - 二进制日志转储线程是一个主库线程。 当从库线程连接的时候,主库可以将二进制日志发送给从库,当主库读取事件的时候,会在Binlog上加锁,读取完成之后,再将锁释放掉。
- 从库I/O线程会连接到主库,向主库发送请求更新Binlog。 这时从库的I/O线程就可以读取到主库的二进制日志转储线程发送的Binlog更新部分,并且拷贝到本地的中继日志。
- 从库SQL线程会读取从库中的中继日志,并且执行日志中的事件,将从库中的数据与主库保持同步。
- 总结起来就是三步:
- 步骤1:Master将写操作记录到二进制日志(binlog),这些记录叫做二进制日志事件(binary log events);
- 步骤2:Slave 将 Master 的 binary log events拷贝到它的中继日志(relay log);
- 步骤3:Slave重做中继日志中的事件,将改变应用到自己的数据库中。
三、搭建一主一从环境
前边的文章已经有写过,这里就不在复述了,点击跳转: MySQL主从复制—有手就能学会的MySQL集群搭建教程
四、如何解决数据一致性问题?
- 进行主从同步的内容是二进制日志,它是一个文件,在进行网络传输的过程中就一定会存在主从延迟,这样就可能造成用户在从库上读取的数据不是最新的数据,也就是主从同步中的数据不一致性问题。
1. 方案一、异步复制
- 异步模式就是
客户端提交COMMIT之后不需要等从库返回任何结果,而是直接将结果返回给客户端
,这样做的好处是不会影响主库写的效率。 - 但这样可能会存在
主库宕机,而Binlog还没有同步到从库
的情况,也就是此时的主库和从库数据不一致。 - 这时候从从库中选择一个作为新主,那么新主则可能缺少原来主服务器中已提交的事务。所以,
这种复制模式下的数据一致性是最弱的
。
2. 方案二、半同步复制
- 半同步复制的原理是在
客户端提交COMMIT之后不直接将结果返回给客户端,而是等待至少有一个从库接收到了Binlog,并且写入到中继日志中,再返回给客户端。
- 这样做的好处是提高了数据的一致性,当然相比于异步复制来说,至少多增加了一个网络连接的延迟,
降低了主库写的效率
。 - 在MySQL5.7版本中还增加了一个参数,
可以对应答的从库数量进行设置
,默认为1,也就是说只要有1个从库进行了响应,就可以返回给客户端。如果将这个参数调大,可以提升数据一致性的强度,但也会增加主库等待从库响应的时间。
3. 方案三、组复制
- 异步复制和半同步复制都无法最终保证数据的一致性问题,半同步复制是通过判断从库响应的个数来决定是否返
回给客户端,虽然数据一致性相比于异步复制有提升,但仍然无法满足对数据一致性要求高的场景。 - 组复制技术MGR很好地弥补了这两种复制模式的不足,它是MySQL在5.7.17版本中推出的一种新的数据复制技术,是
基于Paxos协议的状态机复制
。 - 简单说一下MGR的工作原理:
- 首先我们将多个节点共同组成一个复制组,在执行读写事务的时候,需要通过一致性协议层的同意,也就是读写事务想要进行提交,必须要经过组里“大多数人”(对应Node节点)的同意,大多数指的是同意的节点数量需要大于(N/2+1),这样才可以进行提交,而不是原发起方一个说了算。
- 而针对只读事务则不需要经过组内同意,直接COMMIT即可。
- 在一个复制组内有多个节点组成,它们各自维护了自己的数据副本,并且在一致性协议层实现了原子消息和全局有序消息,从而保证组内数据的一致性。
事实上,Paxos算法远远不止这么简单,它经常被作为分布式一致算法广泛使用,比如zookeeper就是基于它实现的,后边写到zookeeper时还会详细分析…