volatile关键字、JMM与Heppen-Before

119 阅读11分钟

JMM

Java Memory Model 是用于屏蔽不同操作系统内存交互区别的一组抽象概念。Java内存模型描述了Java编程语言中的线程如何通过内存进行交互。提供了Java编程语言的语义。

Java应用程序可能在各种处理器和操作系统上运行,为了能够得出关于程序的行为的确定结论,Java的设计人员决定明确定义所有Java程序的可能性。

即JMM向程序员承诺一系列规则和描述,以便程序员在编程时能确定代码运行的结果,而非受多线程运行中,导致不可预料的运行结果。

主内存与工作内存

Java内存模型的主要目的是定义程序中各种变量的访问规则,即关注在虚拟机中把变量值存储到 内存和从内存中取出变量值这样的底层细节。Java内存模型规定了所有的变量都存储在主内存(Main Memory)中(此处的主内存与物理 硬件的提主内存名字一样,两者也可以类比,但物理上它仅是虚拟机内存的一部分)。

每条线程 还有自己的工作内存(Working Memory,可与前面讲的处理器高速缓存类比),线程的工作内存中保 存了被该线程使用的变量的主内存副本[2],线程对变量的所有操作(读取、赋值等)都必须在工作内 存中进行,而不能直接读写主内存中的数据[3]。

image.png

内存交互

Java内存模型中定义了以下8种操作用于实现主内存与工作内存之间具体的交互协议,即一个变量如何从主内存拷贝到工作内存、如何从 工作内存同步回主内存这一类的实现细节。Java虚拟机实现时必须保证下面提及的每一种操作都是原子的、不可再分的。

  • lock(锁定):作用于主内存的变量,它把一个变量标识为一条线程独占的状态。 ·

  • unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量 才可以被其他线程锁定。

  • read(读取):作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以 便随后的load动作使用。

  • load(载入):作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的 变量副本中。

  • use(使用):作用于工作内存的变量,它把工作内存中一个变量的值传递给执行引擎,每当虚 拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。

  • assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收的值赋给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。

  • store(存储):作用于工作内存的变量,它把工作内存中一个变量的值传送到主内存中,以便随后的write操作使用。

  • write(写入):作用于主内存的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中。

Java内存模型还规定了在执行上述8种基本操作时必须满足如下规则:

  • 不允许read和load、store和write操作之一单独出现,即不允许一个变量从主内存读取了但工作内存不接受,或者工作内存发起回写了但主内存不接受的情况出现。

  • 不允许一个线程丢弃它最近的assign操作,即变量在工作内存中改变了之后必须把该变化同步回主内存。

  • 不允许一个线程无原因地(没有发生过任何assign操作)把数据从线程的工作内存同步回主内存中。

  • 一个新的变量只能在主内存中“诞生”,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量,换句话说就是对一个变量实施use、store操作之前,必须先执行assign和load操作。

  • 一个变量在同一个时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会被解锁。

  • 如果对一个变量执行lock操作,那将会清空工作内存中此变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作以初始化变量的值。

  • 如果一个变量事先没有被lock操作锁定,那就不允许对它执行unlock操作,也不允许去unlock一个被其他线程锁定的变量。

  • 对一个变量执行unlock操作之前,必须先把此变量同步回主内存中(执行store、write操作)。

基于理解难度和严谨性考虑,最新的JSR-133文档中,已经放弃了采用这8种操作去定义Java内存模型的访问协议,缩减为4种:read、write、lock和unlock四种(仅是描述方式改变了,Java内存模型并没有改变)

三大特征

原子性、可见性、有序性三大特征是多线程编程中的重要基石。JMM围绕着在并发过程中这三个特征来建立。

原子性

由Java内存模型来直接保证的原子性变量操作包括read、load、assign、use、store和write,如果应用场景需要一个更大范围的原子性保证(经常会遇到),Java内存模型还提供了lock和unlock操作来满足这种需求,尽管虚拟机未把lock和unlock操作直接开放给用户使用,但是却提供了更高层次的字节码指令monitorenter和monitorexit来隐式地使用这两个操作。这两个字节码指令反映到Java 代码中就是同步块——synchronized关键字,因此在synchronized块之间的操作也具备原子性。

可见性

可见性就是指当一个线程修改了共享变量的值时,其他线程能够立即得知这个修改。volatile、synchronized、final都能保证变量的修改及时同步到其他线程的工作内存。

有序性

Java语言提供了volatile和synchronized两个关键字来保证线程之间操作的有序性,volatile关键字本身就包含了禁止指令重排序的语义,而synchronized则是由“一个变量在同一个时刻只允许一条线程对其进行lock操作”这条规则获得的,这个规则决定了持有同一个锁的两个同步块只能串行地进入。

Heppen-Before原则

Heppen-Before原则是Java内存模型下一些“天然的”先行发生关系,这些先行发生关系无须任何同步器协助就已经存在,可以在编码中直接使用。如果两个操作之间的关系不在此列,并且无法从下列规则推导出来,则它们就没有顺序性保障,虚拟机可以对它们随意地进行重排序。

Heppen-Before原则是用来判断是否存数据竞争、线程是否安全的主要依据,它保证了多线程环境下的可见性

  • 程序次序规则(Program Order Rule):在一个线程内,按照控制流顺序,书写在前面的操作先行发生于书写在后面的操作。注意,这里说的是控制流顺序而不是程序代码顺序,因为要考虑分支、循环等结构。

  • 管程锁定规则(Monitor Lock Rule):一个unlock操作先行发生于后面对同一个锁的lock操作。这里必须强调的是“同一个锁”,而“后面”是指时间上的先后。

  • volatile变量规则(Volatile Variable Rule):对一个volatile变量的写操作先行发生于后面对这个变量的读操作,这里的“后面”同样是指时间上的先后。

  • 线程启动规则(Thread Start Rule):Thread对象的start()方法先行发生于此线程的每一个动作。

  • 线程终止规则(Thread Termination Rule):线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过Thread::join()方法是否结束、Thread::isAlive()的返回值等手段检测线程是否已经终止执行。

  • 线程中断规则(Thread Interruption Rule):对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生,可以通过Thread::interrupted()方法检测到是否有中断发生。

  • 对象终结规则(Finalizer Rule):一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始。

  • 传递性(Transitivity):如果操作A先行发生于操作B,操作B先行发生于操作C,那就可以得出操作A先行发生于操作C的结论。

volatile

运算结果并不依赖变量的当前值,或者能够确保只有单一的线程修改变量的值。 变量不需要与其他的状态变量共同参与不变约束。

有序性保证

为了实现volatile的内存语义,JMM会限度特定类型的编译器和处理器重排序,JMM会针对编译器制订volatile重排序规定表, 总结来说就是:

  • 第二个操作是volatile写,不论第一个操作是什么都不会重排序
  • 第一个操作是volatile读,不论第二个操作是什么都不会重排序
  • 第一个操作是volatile写,第二个操作是volatile读,也不会产生重排序

进一步,通过插入内存屏障保障的,JMM层面的内存屏障分为读(load)屏障和写(Store)屏障,排列组合就有了四种屏障。对于volatile操作,JMM内存屏障插入策略:

  • 在每个volatile写操作的后面插入一个StoreStore屏障
  • 在每个volatile写操作的前面插入一个StoreLoad屏障
  • 在每个volatile读操作的前面插入一个LoadLoad屏障
  • 在每个volatile读操作的前面插入一个LoadStore屏障 以上内存屏障是JMM给出逻辑概念,在具体底层实现随硬件的不同而改变。

以X86平台为例,主要提供了这几种内存屏障指令:

  • lfence指令:在lfence指令前的读操作当必须在lfence指令后的读操作前实现,相似于读屏障
  • sfence指令:在sfence指令前的写操作当必须在sfence指令后的写操作前实现,相似于写屏障
  • mfence指令: 在mfence指令前的读写操作当必须在mfence指令后的读写操作前实现,相似读写屏障。

JMM标准须规定了这么多内存屏障,但实际硬件上并不需要加这么多内存屏障。以X86处理器为例,X86处理器不会对读-读读-写写-写操作做重排序,会省略掉这3种操作类型对应的内存屏障,仅会对写-读操作做重排序。所以volatile写-读操作只须要在volatile写后插入StoreLoad屏障。 而在x86处理器中,有三种办法能够实现实现StoreLoad屏障的成果,分别为:

  • mfence指令:上文提到过,能实现全能型屏障,具备lfence和sfence的能力。
  • cpuid指令:cpuid操作码是一个面向x86架构的处理器补充指令,它的名称派生自CPU辨认,作用是容许软件发现处理器的详细信息。
  • lock指令前缀:总线锁。

实际上HotSpot对于volatile的实现就是应用的lock指令,只在volatile标记的中央加上带lock前缀指令操作,并没有参照JMM标准的屏障设计而应用对应的mfence指令。

可见性保证

可见性保证本质上就是禁用缓存,Lock总线锁,使其他线程内的副本失效,以保证数据一致。

Lock指令的作用:

  • 确保后续指令执行的原子性。在Pentium及之前的处理器中,带有lock前缀的指令在执行期间会锁住总线,使得其它处理器临时无奈通过总线拜访内存,很显然,这个开销很大。在新的处理器中,Intel应用缓存锁定来保障指令执行的原子性,缓存锁定将大大降低lock前缀指令的执行开销。
  • 禁止该指令与后面和前面的读写指令重排序。
  • 把写缓冲区的所有数据刷新到内存中。

资料来源