前言
经常听到大家说CAP理论,那么什么是CAP理论呢,现在就简单了解一下。
什么是CAP理论
要想明白什么是CAP理论,就必须明白C、A、P分别代表什么意思。
C:Consistency (强一致性)
A:Applicability (可用性)
P:Partition tolerance (分区容错性)
就是说在分布式存储系统中,最多只能实现上面的两点。
而由于当前的网络硬件肯定会出现延迟丢包等问题,所以
分区容错性是我们必须需要实现的。
因此我们只能在一致性和可用性之间进行权衡,没有什么存储系统(包括关系型数据库和非关系型数据库)能同时保证这三点。
C:强一致性 A:高可用性 P:分布式容忍性
CA:传统Oracle数据库
AP:大多数网站架构的选择
CP:Redis、Mongodb
注意:分布式架构的时候必须做出取舍。
一致性和可用性之间取一个平衡。多余大多数web应用,其实并不需要强一致性。
因此牺牲C换取P,这是目前分布式数据库产品的方向。
CAP理论的核心
CAP理论的核心是:一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个。
因此,根据 CAP 原理将 NoSQL 数据库分成了满足 CA 原则、满足 CP 原则和满足 AP 原则三大类:
CA - 单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大。
CP - 满足一致性,分区容忍性的系统,通常性能不是特别高。
AP - 满足可用性,分区容忍性的系统,通常可能对一致性要求低一些。
以下就是经典的CAP图

BASE
BASE就是为了解决关系数据库强一致性引起的可用性降低而提出的解决方案。它包括:
基本可用(Basically Available)
软状态(Soft state)
最终一致(Eventually consistent)
它的思想是通过让系统放松对某一时刻数据一致性的要求来换取系统整体伸缩性和性能上改观。为什么这么说呢,缘由就在于大型系统往往由于地域分布和极高性能的要求,不可能采用分布式事务来完成这些指标,要想获得这些指标,我们必须采用另外一种方式来完成,这里BASE就是解决这个问题的办法。