Java并发机制底层实现原理Java代码在编译后会变成Java字节码，字节码被类加载器加载到JVM里，JVM执行字节码，

这是我参与11月更文挑战的第10天，活动详情查看：2021最后一次更文挑战

Java代码在编译后会变成Java字节码，字节码被类加载器加载到JVM里，JVM执行字节码，最终需要转化为汇编指令在CPU上执行，Java中所使用的并发机制依赖于JVM的实现和CPU的指令

CPU可以直接操作自己对应的高速缓存，不需要直接频繁的跟主内存通信，这样可以保证CPU的计算的效率非常的高。

一、volatile应用

在多线程并发编程中synchronized和Volatile都扮演着重要的角色，volatile它在多处理器开发中保证了共享变量的可见性。当一个线程修改一个共享变量时，另外一个线程能读到这个修改的值。本文将深入分析在硬件层面上处理器是如何实现volatile的。

二、volatile的定义与实现原理

Java编程语言允许线程在访问共享变量，为了确保共享变量能被准确和一致地更新，线程应该确保通过排他锁单独获得这个变量。提供了volatile，在某些情况下比锁要更加方便，如果一个字段被声明成volatile，Java线程内存模型确保所有线程看到这个变量的是值是一致的。

volatile实现原理相关的CPU术语与说明。\

image.png

volatile是如何来保证可见性的，通过获取编译器生成的汇编指令来查看对volatile进行写操作时，CPU会怎么处理。\

image.png

有volatile变量修饰的共享变量进行写操作时会多出第二行汇编代码，Lock前缀的指令在多核处理器下会做二件事情。
1）Lock前缀指令会引起处理器缓存回写到内存
Lock前缀指令导致在执行指令期间，声言处理器的Lock信号。在多处理器环境中，Lock信号确保在声言该信号期间，处理器可以独占任何共享内存。Lock信号一般不锁总线，而是锁缓存，锁总线开锁比较大。在锁操作时，总是在总线上声言Lock信号，如果访问的内存区域已经缓存在处理器内存，则不会声言Lock信号。相反它会锁定这块内存区域的缓存并回写到主内存，并使用缓存一致性机制来确保修改的原子性，此操作被称为缓存锁定，缓存一致性机制会阻止同时修改由两个以上处理器缓存的内存区域数据。
2）一个处理器的缓存回写到内存会导致其他处理器的缓存无效
处理器使用MESI（修改、独占、共享、无效）控制协议去维护内部缓存和其他处理器缓存的一致性。在多核处理器系统中进行操作时，处理器能嗅探其他处理器访问系统内存和它们的内部缓存。处理器使用嗅探技术保证它的内部缓存、系统主内存和其他处理器的缓存数据在总线上保持一致。如果通过嗅探一个处理器来检测其他处理器打算写内存地址，而这个地址当前处于共享状态，那么正在嗅探的处理器将使它的缓存行无效，在下次访问相同内存地址时，强制执行缓存行填充。\

03_java内存模型.png

为了提高处理速度，处理器不直接和内存进行通信，而是先将系统内存的数据读到内部缓存（L1、L2、或其他）后再进行操作，但是操作完不知道何时会写到内存。如果对发声明了volatile的变量进行写操作，JVM就会向处理器发送一条Lock前缀的指令，将这个变量所在缓存行的数据写回到系统内存。但是写回到主内存，如果其他处理缓存的值还是旧的，再执行计算操作就会有问题。所以，在多处理器下，为了保证各个处理的缓存是一致的，就会实现缓存一致性协议，每个处理器通过嗅探在总线上传播的数据来检查自己缓存的值是不是过期了，当处理发现自己缓存行对应的内存地址被修改，就会将当前处理器的缓存行设置成无效状态，当处理对这个数据进行修改操作时，会重新从系统主内存中把数据读到处理器缓存里。

read    从主内丰读取
load    将主内存读取到的值写入工作内存
use        从工作内存读取数据来计算
assign    将计算好的值重新赋值到工作内存中
store    将工作内存数据写入主内存
write    将store过去的变量值赋值给主内存中的变量

三、volatile的内存语义

只要是volatile变量，对该变量的读/写就具有原子性，如果是多个volatile操作或类似于volatile++这种复合操作，这些操作整体上不具有原子性。

3.1、volatile变量自身具有下列特性
1）可见性：对一个volatile变量的读，总是能看到（任意线程）对这个volatile变量最后的写入；
2）原子性：对任意单个volatile变量的读/写具有原子性，但类似于volatile++这种复合操作不具有原子性；
3）有序性：指令重排序，编译器和指令器有时为了提高代码执行效率，会将指令重排序，要遵守一定的规则，happens-before原则，只要符合happens-before的原则，那么就不能重排，如果不符合这些规则的话，那就可以重排序

3.2、volatile写-读的内存语义
volatile写的内存语义：当写一个volatile变量时，JMM会把该线程对应的本地内存中的共享变量值刷新到主内存。\

image.png

线程A在写flag变量后，本地内存A中被线程A更新过的两个共享变量的值被刷新到主内存中，此时，本地内存A和主内存中的共享变量的值是一致的。

volatile读的内存语义：当读一个volatile变量时，JMM会把该线程对应的本地内存置为无效。线程接下来将从主内存中读取共享变量。\

image.png

在读flag变量后，本地内存B包含的值已经被置为无效，此时，线程B必须从主内存中读取共享变量，线程B的读取操作将导致本地内存B与主内存中共享变量的值变成一致。

总结：
1）线程A写一个volatile变量，实质上是线程A向接下来将要读这个volatile变量的某个线程发出了（其对共享变量所做修改的）消息；
2）线程B读一个volatile变量，实质上是线程B接收了之前某个线程发出的（在写这个volatile）变量之前对共享变量所做修改的）消息；
3）线程A写一个volatile变量，随后线程B读这个volatile变量，这个过程实质上是线程A通过主内存向线程B发送消息；

3.3、volatile内存语义的实现

重排序分为编译器重排序和处理器重排序。为了实现volatile内存语义，JMM会分别限制这两种类型的重排序类型。

为了实现volatile的内存语义，编译器在生成字节码时，会在指令序列中插入内存屏障来禁止特定类型的处理器重排序。为此，基于保守策略的JMM内存屏障插入策略。

1）、在每个volatile写操作的前面插入一个StoreStore屏障；
2）、在每个volatile写操作的后面插入一个StoreLoad屏障；
3）、在每个volatile读操作的后面插入一个LoadLoad屏障；
4）、在每个volatile读操作的后面插入一个LoadStore屏障；

volatile写插入内存屏障后生成的指令序列示意图：\

image.png

StoreStore屏障可以保证在volatile写之前，其前面的所有普通写操作已经对任意处理歌可见了，因为StoreStore屏障将保障上面所有的普通写在volatile写之前刷新到主内存。

StoreLoad屏障可以避免volatile写与后面可能有的volatile读/写操作重排序。JMM在采取了保守策略：在每个volatile写的后面，或者在每个volatile读的前面插入一个StoreLoad屏障。

volatile读插入内存屏障后生成的指令序列示意图：\

image.png

LoadLoad屏障用来禁止处理器把上面的volatile读与下面的普通读重排序。
LoadStore屏障用来禁止处理器把上面的volatile读与下面的普通写重排序。

LoadLoad屏障：Load1;LoadLoad;Load2,确保Load1数据的装载先于Load2后所有装载指令；

StoreStore屏障：Store1;StoreStore;Store2,确保Store1的数据一定刷回主存，对其他CPU可见，先于Store2以及后续指令；

LoadStore屏障：Load1;LoadStore;Store2,确保Load1指令的数据装载，先于Store2以及后续指令；

StoreLoad屏障：Store1;StoreLoad;Load2,确保Store1指令的数据一定刷回主存，对其他CPU可见，先于Load2以及后续指令的数据装载；

  <br />