多线程之Java内存模型

626

前言

Java内存模型(JMM)是属于多线程的内容,与jvm内存区域是两个不同的概念。其实要更深入的去理解java内存模型是需要明白相关操作系统知识的,这样才会清楚为啥要那么设计。

概念

Java内存模型(Java Memory Model)本身是一个抽象概念,并不真实存在,它描述的是一种规范,Java内存模型的主要目标是通过这组规范去定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存中取出变量这样底层细节,说更糙一点,其实就是主内存和工作内存那一套。此处的变量与Java编程时所说的变量不一样,指包括了实例字段、静态字段和构成数组对象的元素 (实例字段,静态字段和构成数组对象的元素主要存储于方法区,而方法区是线程共享的数据区域,所以才能被save和load), 但是不包括局部变量与方法参数,后者是线程私有的,不会被共享。 (局部变量和方法参数主要存储于虚拟机栈,而虚拟机栈是线程私有的)

正题

  • 主内存和工作内存 Java内存模型中规定了所有的变量都存储在主内存中,每条线程还有自己的工作内存,线程的工作内存中保存了该线程使用到的变量到主内存副本拷贝,线程对变量的所有操作(读取、赋值)都必须在工作内存中进行,而不能直接读写主内存中的变量。不同线程之间无法直接访问对方工作内存中的变量,线程间变量值的传递均需要在主内存来完成,线程、主内存和工作内存的交互关系如下图所示 image.png
  • JMM中的变量指的是线程共享变量(实例变量,static字段和数组元素),不包括线程私有变量(局部变量和方法参数)
  • JMM规定线程对变量的写操作都在自己的本地内存对副本进行,不能直接写主存中的对应变量
  • 多线程间变量传递通过主内存完成(Java线程通信通过共享内存),线程修改变量后通过本地内存写回主内存,从主存读取变量,彼此不允许直接通信(本地内存私有原因) 综上,JMM通过控制主存和每个线程的本地内存的数据交互,保证一致的内存可见性;

这里的主内存,工作内存与Java内存区域的堆,栈,方法区等并不是同个层次上的划分,前面就已说过内存模型只是一种概念,如果非要将两者联系起来,那么主内存主要对应于Java堆中的对象实例数据部分(堆线程共享),工作内存主要对应于虚拟机栈的部分区域(虚拟机栈线程私有)

  • 内存间交互操作 关于主内存与工作内存之间的具体交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步到主内存之间的实现细节,Java内存模型定义了以下八种操作来完成,虚拟机实现时必须保证下面提及的每一种操作都是原子的,不可再分。定义这些交互操作的目的就是为了主内存与工作内存不混乱:
  • lock(锁定):作用于主内存的变量,把一个变量标识为一条线程独占状态。
  • unlock(解锁):作用于主内存变量,把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
  • read(读取):作用于主内存变量,把一个变量值从主内存传输到线程的工作内存中,以便随后的load动作使用
  • load(载入):作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
  • use(使用):作用于工作内存的变量,把工作内存中的一个变量值传递给执行引擎,每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。
  • assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收到的值赋值给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
  • store(存储):作用于工作内存的变量,把工作内存中的一个变量的值传送到主内存中,以便随后的write的操作。
  • write(写入):作用于主内存的变量,它把store操作从工作内存中一个变量的值传送到主内存的变量中。 如果要把一个变量从主内存中复制到工作内存,就需要按顺序地执行read和load操作,如果把变量从工作内存中同步回主内存中,就要按顺序地执行store和write操作。Java内存模型只要求上述操作必须按顺序执行,而没有保证必须是连续执行。也就是read和load之间,store和write之间是可以插入其他指令的。

除此之外,Java内存模型还规定在执行上述8种操作时必须满足如下规则:

  • 不允许read和load、store和write操作之一单独出现
  • 不允许一个线程丢弃它的最近assign的操作,即变量在工作内存中改变了之后必须同步到主内存中。
  • 不允许一个线程无原因地(没有发生过任何assign操作)把数据从工作内存同步回主内存中。
  • 一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量。即就是对一个变量实施use和store操作之前,必须先执行过了assign和load操作。
  • 一个变量在同一时刻只允许一条线程对其进行lock操作,lock和unlock必须成对出现
  • 如果对一个变量执行lock操作,将会清空工作内存中此变量的值,在执行引擎使用这个变量前需要重新执行load或assign操作初始化变量的值
  • 如果一个变量事先没有被lock操作锁定,则不允许对它执行unlock操作;也不允许去unlock一个被其他线程锁定的变量。
  • 对一个变量执行unlock操作之前,必须先把此变量同步到主内存中(执行store和write操作) 这8种内存访问操作以及上述规则限定,再加上对volatile的一些特殊规定,就可以完全确定Java程序中哪些内存访问操作在并发下是安全的
    虽然如此,但由于定义繁琐,实践起来很麻烦。所以用这种定义的一个等效判断原则————先行发生原则,来确定一个访问在并发环境下是否安全。