Java并发编程 之 JMM

195 阅读6分钟

JMM的定义

JMM是Java虚拟机规范中定义的Java内存模型(Java Memory Model),其主要作用是用来屏蔽掉各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的并发效果,JMM规范了Java虚拟机与计算机内存是如何协同工作的。

JMM的规定

简单来说JMM规定了Java中各种变量的读写访问规则:

  • 所有变量都存储在主内存中(这里的变量指的是实例变量、静态变量;不包括局部变量或者方法的参数,因为后者是线程私有的,不会被共享,也就无需定义访问规则。)
  • 每个线程都有自己的工作内存(保存了使用的变量的主内存的副本),所有操作都必须在工作内存中进行。
  • 那么不同的线程之间如果需要共享变量的值,就需要通过主内存来完成。

image.png

并发三大特性

JMM是围绕并发三大特性建立起来的。

  • 原子性 指一个或多个操作是不可分割,不可中断的,要么全部执行且执行过程中不被任何因素打断,要么全部不执行。在Java中,对基本数据类型的变量的读取和赋值操作是原子性操作,不采取任何的原子性保障措施的自增操作并不是原子性的。如下代码:
int i = 3; // 基本类型赋值操作,必定是原子性操作。
int j = i; // 这句需要先读取i的值,再赋值给j,是两步操作,不能保证原子性。
i++; // 自增操作需要先读取i的值,再加1,最后赋值给i,是三步操作,不能保证原子性。
i = i + 1// 跟上面自增等效。
  • 可见性 当一个线程对共享变量进行修改,其他线程能够立刻看到。Java 内存模型是通过在变量修改后将新值同步回主内存,在变量读取前从主内存刷新变量值这种依赖主内存作为传递媒介的方法来实现可见性的。

在编码层面,Java是利用volatile关键字来提供可见性的。 当变量被volatile修饰时,这个变量被修改后会立刻刷新到主内存,当其它线程需要读取该变量时,会去主内存中读取新值。而普通变量则不能保证这一点。

除了volatile关键字之外,final和synchronized也能实现可见性。

synchronized的原理是,在执行完,进入unlock之前,必须将共享变量同步到主内存中。

final修饰的字段,一旦初始化完成,如果没有对象逸出(指对象为初始化完成就可以被别的线程使用),那么对于其他线程都是可见的。

  • 有序性 程序执行的顺序按照代码的先后顺序执行。JVM中存在指令重排,所以会存在有序性问题。

在Java中,可以使用synchronized或者volatile保证多线程之间操作的有序性。实现原理有些区别:

  1. volatile关键字是使用内存屏障达到禁止指令重排序,以保证有序性。

  2. synchronized的原理是,一个线程lock之后,必须unlock后,其他线程才可以重新lock,使得被synchronized包住的代码块在多线程之间是串行执行的。

JMM 8 种内存交互操作

关于主内存与工作内存之间的具体交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步到主内存之间的实现细节,Java内存模型定义了以下八种操作来完成: image.png

  • lock(锁定):作用于主内存的变量,把一个变量标识为一条线程独占状态。
  • read(读取):作用于主内存变量,把一个变量值从主内存传输到线程的工作内存中,以便随后的load动作使用。
  • load(载入):作用于工作内存变量,把read操作从主内存中得到的变量值放入工作内存的变量副本中。
  • use(使用):作用于工作内存变量,把工作内存中一个变量值传递给执行引擎,每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。
  • assign(赋值):作用于工作内存变量,把一个从执行引擎接收到的值赋值给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
  • store(存储):作用于工作内存的变量,把工作内存中的一个变量的值传送到主内存中,以便随后的write操作。
  • write(写入):作用于主内存变量,把store操作从工作内存中一个变量的值传送到主内存变量中。
  • unlock(解锁):作用于主内存变量,把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。

Java内存模型还规定了在执行上述八种基本操作时,必须满足以下规则:

  • 如果一个变量从主内存中复制到工作内存,就需要按顺序执行read和load操作,如果变量从工作内存中同步回主内存中,就要按顺序地执行store和write操作。但Java内存模型值要求上述操作必须按照顺序执行,并没有保证必须是连续执行。
  • 不允许read和load,store和write操作之一单独出现。也就是read操作后必须load,store操作后必须write。
  • 不允许一个线程丢弃它的最近assign操作,即变量在工作内存中改变之后必须同步到主内存中。
  • 不允许一个线程无原因地(没有发生过任何assign操作)把数据从工作内存同步回主内存中。
  • 一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化的变量。即就是对一个变量实施use和store操作之前,必须先执行过了assign和load操作。
  • 一个变量在同一时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会被解锁。lock和unlock必须成对出现。
  • 如果一个变量执行lock操作,将会清空工作内存中此变量的值,在执行引擎使用这个变量前需要重新执行load或assign操作初始化变量的值。
  • 如果一个变量事先没有被lock操作锁定,则不允许对它执行unlock操作,也不允许去unlock一个被其他线程锁定的变量。
  • 对一个变量执行unlock操作之前,必选先把此变量同步到主内存中(执行store和write操作)。