并发基础（二）：CPU多级缓存与缓存一致性在上一篇文章《并发基础（一）：线程安全》中提到了为了解决CPU处理器与内存之间

尺有所短，寸有所长；不忘初心，方得始终。

请关注公众号：星河之码

在上一篇文章《并发基础（一）：线程安全》中提到了为了解决CPU处理器与内存之间的读写效率的问题，在CPU和内存之间加入了高速缓存。那么这个缓存是如何解决它们之间的问题的呢？又带来了什么问题呢？

一、Cache的作用

缓存的作用就是为了解决CUP与内存之间的效率不匹配问题，提高CPU利用率的，(cpu ->cache->memory)。

类似日常生活中的超市，超市从工厂把商品存储起来，人们可以直接购买，省掉人们从工厂购买所需要的时间开销。

随着现代半导体工艺的发展，cpu cache已经发展到了三级缓存结构，基本上现在买的个人电脑都是L3结构。

二、Cache的工作原理

CPU cache既然是缓存，那么容量肯定是远远小于主存的，因此肯定会出现缓存未命中的情况，基于此cache的意义在哪里呢？

缓存的容量要是能达到内存一样，那还要内存干啥？价格，技术都是限制缓存容量的条件

之前讲mysql的文章中，有一篇《MySQL十六：36张图理解Buffer Pool》在讲预读的时候，提到一个概念——局部性原理。实际cache 的工作原理是也是基于【局部性原理】，它包含两个方面：

时间局部性：如果某个数据被访问，那么在不久的将来它很可能被再次访问。
空间局部性：如果某个数据被访问，那么与它相邻的数据很快也可能被访问。

也就是说：CPU cache在一定程度上可以理解为预读，将数据从内存读取到缓存中，提供给执行引擎使用。

三、Cache的结构

随着现代半导体工艺的发展，CPU也从最开始的单核发展到现在的多核，多核CUP的结构在单核CPU基础上也做了升级隔离

单核CPU cache结构

在单核CPU结构中，为了防止CPU指令流水中循环冲突，一级缓存L1分成了指令（L1P）和数据（L1D）两部分，而二级缓存L2则是指令和数据共存。示意图如下：
多核CPU cache结构

多核CPU的结构相比单核CPU，其结构多了三级缓存L3，在多核CPU的结构中，L1和L2是CPU私有的，L3则是所有CPU核心共享的。示意图如下：
CPU读取数据的过程

cache中保存着cpu刚用过的数据或者是循环使用的数据，从cache中读取数据就会很快，减少了cpu等待的时间，提高了系统的性能。

从上图可看出，内存中读取数据到缓存中的时候，需要经过总线，因此我们可以通过缓存一致性(MESI)或者锁住总线的方式来解决缓存不一的问题。

四、缓存一致性

在多核CPU中，内存中的数据会在多个核心中存在数据副本，某一个核心发生修改操作，其他核心无法立即知晓，就产生了数据不一致的问题。而一致性协议则是用于保证多个CPU cache之间缓存共享数据的一致。

常见的缓存一致性协议有如MSI、MESI、MOSI、MOESI、MERSI、MESIF、write-once、Synapse、Berkeley、Firefly和Dragon协议等，其中最经典的MESI协议。

缓存不一致

如上图，在共享内存多处理器系统中，每个处理器都有一个单独的缓存内存，共享数据可能有多个副本，当两个CPU核心读取了数据副本后，当某个CPU修改了数据并且更新了内存资源的缓存时，可能会出现数据不一致的问题。

缓存一致性

在共享内存多处理器系统中，每个处理器都有一个单独的缓存内存，共享数据可能有多个副本：当数据的一个副本发生更改时，其他副本必须反映该更改。缓存一致性是确保共享操作数(数据)值的变化能够及时地在整个系统中传播的过程。也就是【写传播】。

4.1 cache的写方式

在《计算机组成原理》一书中有提到cache的写操作方式包含write through和write back两种方式：

Write-through（直写）：每次CPU修改了cache中的内容，立即更新到内存，使cache和memory的数据保持一致。

也就意味着每次CPU写内存共享数据，都会导致总线事务，因此这种方式常常会引起总线事务的竞争，高一致性，但是效率非常低
Write-back（回写）：每次CPU修改了cache中的数据，不会立即更新到内存，而是等到cache line在某一个必须或合适的时机才会更新到内存中

无论是直写通还是回写，在多核环境下都需要处理缓存cache一致性问题。为了保证缓存一致性，处理器还提供了写失效（write invalidate）和写更新（write update）两个操作来保证cache一致性。

写失效（write invalidate）：当一个CPU修改了数据，如果其他CPU有该数据，则通知其为无效；
写更新（write update）：当一个CPU修改了数据，如果其他CPU有该数据，则通知其跟新数据，（写更新

会导致大量的更新操作）。

MESI协议就是使用的写失效（MESI中的I：ivalid），MESU协议使用的写更新

4.2 cache line

在write back（写回）中，CPU修改了数据后，会等到cache line在某一个必须或合适的时机才会更新到内存中，那cache line又是什么呢？

cache line是cache与内存数据交换的最小单位，根据操作系统一般是32byte或64byte。其结构如下

cache line可分为状态，地址，数据三个部分，在MESI协议中，状态分为四种：M、E、S、I，地址则是cache line中映射的内存地址，数据则是从内存中读取的数据。

cache line工作方式

当CPU从cache中读取数据的时候，会比较地址是否相同，如果相同则检查cache line的状态，再决定该数据是否有效，无效则从主存中获取数据，或者根据一致性协议发生一次cache-to--chache的数据推送。
cache line工作效率

当CPU能够从cache中拿到有效数据的时候，消耗几个CPU cycle（CPU指令周期），如果缓存未命中，则会消耗几十上百个CPU cycle。

五、MESI

5.1 MESI是什么

MESI为了保证多个CPU缓存中共享数据的一致性，定义了cache line的四种状态，而CPU对cache line的四种操作可能会产生不一致的状态，因此缓存控制器监听到本地操作和远程操作的时候，需要对地址一致的cache line 状态进行一致性修改，从而保证数据在多个缓存之间保持一致性。。

MESI是指4个状态的首字母(M:modified E:Exclusive S:shared I:invalid) ，每个cache line有4个状态，可以用2个bit表示：

状态	描述	监听任务
M(Modified)修改	数据有效，被修改了，和内存中的数据不一致，数据只存在于本Cache中。	缓存行必须监听所有视图中【读该缓存行所对应的主存】操作，这些操作必须在将【该缓存行写回主存并将状态改为S状态】之后执行
E(Exclusive)：独享	数据有效，数据和内存中的数据一致，数据只存在于本Cache中。	缓存行必须监听其他缓存【读取该缓存行对应的主存】操作，一旦有这种操作，该缓存行需要变成S状态
S(Shared)：共享	数据有效，数据和内存中的数据一致，并且数据存在于很多Cache中。	缓存行必须监听其他缓存使该缓存行无效的请求
I(Invalid)：无效	该缓存行无效

E(Exclusive)

只有Core 0访问变量x，它的Cache line状态为E(Exclusive)。
S(Shared)

3个Core都访问变量x，它们对应的Cache line为S(Shared)状态。
M(Modified) 和I(Invalid)

Core 0修改了x的值之后，这个Cache line变成了M(Modified)状态，其他Core对应的Cache line变成了I(Invalid)状态。

5.2 MESI四种状态流转

在MESI协议中，每个Cache的Cache控制器不仅知道自己的读写操作，而且也监听(snoop)其它Cache的读写操作。每个Cache line所处的状态根据本核和其它核的读写操作在4个状态间进行迁移。

也就是说：4种操作控制4种状态的流转。4种操作如下：

local read：内核读取本地缓存中的值
local write：本地内核写本地缓存中的值
remote read：其它内核读取其他缓存中的值
remote write：其它内核更改其他缓存中的值

协议时序图如下：

如上图根据4种操作更改了相应的状态，箭头表示本Cache line状态的迁移，环形箭头表示状态不变。四种状态的迁移过程

缓存可以随时将一个非M状态的缓存行作废，或者变成Invalid状态，而一个M状态的缓存行必须先被写回主存。

一个处于M状态的缓存行必须时刻监听所有试图【读该缓存行相对的主存】的操作，这些操作必须在将【该缓存行写回主存并将状态改为S状态】之后执行
一个处于S状态的缓存行也必须监听其它缓存使【该缓存行无效或者独享该缓存行】的操作，并将该缓存行变成无效（Invalid）。
一个处于E状态的缓存行也必须监听其它缓存【读该缓存行相对的主存】的操作，一旦有这种操作，该缓存行需要变成S状态。