java虚拟机读书笔记 第十二章 java内存模型与线程

234 阅读8分钟

java内存模型

java虚拟机规范中试图定义一个java内存模型来屏蔽掉各种硬件和操作系统的内存访问差异,以实现让java程序在各个平台都能达到一致的内存访问效果。

1.主内存和工作内存

java内存模型的主要目标是定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存中取出变量这样的底层细节。这些变量包括实例字段、静态字段和构成数组对象的元素,包括局部变量和方法操作,因为是线程私有的,不会被共享。

java内存模型规定了所有的变量都存储在主内存上,此外每个线程还有自己的工作内存,线程的工作内存中保存了被线程用到的变量的主内存副本拷贝,线程对变量的所有操作(读取和赋值)都必须在工作内存中进行,不能直接读写主内存中的变量。线程间变量的传值,需要通过主内存来完成。

2.内存间交互操作

主内存和工作内存的交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步会主内存的实现细节,java内存模型中定义了8中操作来完成,虚拟机必须保证每一种操作都是原子性的

  • lock(锁定):作用于主内存的变量,把一个变量标识为一个线程独占的状态;
  • unlock(解锁):作用于主内存的变量,把一个处于锁定状态的变量释放出来,可以被其他的线程访问;
  • read(读取):作用于主内存变量,把一个变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用;
  • load(载入):作用于工作内存的变量,它把read操作从主内存得到的变量值放入工作内存的变量内存副本中;
  • use:作用于工作内存的变量,把工作内存的一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用到变量的值的字节码指令是都会执行这个操作;
  • assign(赋值):作用于工作内存的变量,把从执行引擎的接受到的执行结果赋值给工作内存的变量;
  • store(存储):作用于工作内存的变量,把工作内存一个变量的值传输到主内存中,以便随后write使用;
  • write(写入):作用于主内存的变量,把store操作从工作内存得到的值放入主内存的变量中。

此外java内存模型还规定了在执行8中操作的时候必须满足以下规则:

  1. 不允许read和load、store和write单独出现
  2. 不允许一个线程丢弃它的最近assign操作,即工作内存变量修改后必须同步回主内存;
  3. 不允许一个变量没有任何assign操作就把数据从工作内存同步回主内存;
  4. 一个新的变量只能在主内存中”生成“,不允许工作线程使用一个未被初始化的变量,即对一个变量进行use、store操作之前,必须要有load、assign操作;
  5. 一个变量在同一时刻只允许一个线程对其进行lock操作;
  6. 对一个变量lock时,会清空工作内存此变量的值,在使用时重新load或assign来初始化变量值;
  7. 如果一个变量没有lock操作,不允许对其执行unlock操作;
  8. 对一个变量执行unlock时必须执行store、write把变量值同步回主内存;

volatile类型变量

当一个变量定义为volatile之后,它将具备两种特性,第一是保证此变量对所有线程的可见性,当一个线程修改了这个变量的值之后,对于其他线程而言是立刻得知的。当时java里面的运算非原子操作,导致volatile变量的运算在并发环境下一样时不安全的。

volatile变量只能保证可见性,在不符合下面两条分这的运算场景中,依然要通过加锁。

  1. 运算结果并不依赖变量的值,或者能够保证只有单一线程修改变量的值;
  2. 变量不需要于其他的状态变量共同参与不变约束。

volatile第二个语义是禁止重排序。volatile的读操作性能消耗与普通变量几乎没有差别,写操作性能会差一点,需要插入内存屏障来禁止重排序。

java内存模型的特征是:原子性、可见性、有序性。

  • 原子性:由java内存模型来直接保证的原子操作包括,read、load、assign、use、store、write;synchronized块之间也具备原子性。
  • 可见性:是指当一个线程修改了共享变量的值,其他线程能够立刻得知这个改变。除了volatile之外,synchronized和final也能实现可见性。
  • 有序性:java本身的有序性,如果在本线程中观察,所有操作都是有序的,如果在一个线程观察另一个线程,所有操作都是无序的。java语言提供了synchronized和volatile来保证线程之间的有序性。synchronized通过保证一个变量在同一时刻只有一个线程能对其进行lock操作保证的;volatile通过禁止重排序实现。 如果java内存模型中所有的有序性都仅仅靠volatile和synchronized来完成,那么我们编写java代码将会非常繁琐。事实上我们在编写java并发代码的时候并没有感觉到这一点,这是因为java语言中的happens-before原则。happens-before原则是JMM最核心的概念。

从JMM设计者的角度,在设计JMM是需要考虑到两个关键因素:

  • 程序员对内存模型的使用:程序员希望内存模型,易于理解,易于编程。程序员希望基于一个强内存模型来编写代码。
  • 编译器和处理器对内存模型的实现:编译器和处理器希望对他们的约束越少越好,编译器和处理器希望一个弱内存模型。

happens-before规则如下:

  1. 程序次序规则(Program Order Rule):在一个线程内,按照程序代码顺序;
  2. 管程锁定原则(Monitor Lock Rule):一个unlock操作先行发生于后面对同一个锁的lock操作;
  3. volatile变量规则(volatile variable Rule):对一个volatile变量的写操作先发生于后面对这个变量读;
  4. 线程启动规则(Thread Start Rule):Thread对象的start()方法先行发生于此线程的每一个动作;
  5. 线程终止规则(Thread Termination Rule):线程中的所有操作都先发生于对线程的终止检测,Thread.isAlive
  6. 线程中断规则(Thread Interruption Rule):对线程的interrupt方法的调用优先发生于被中断线程的代码检测到中断发生。
  7. 对象终结操作(Finalizer Rule):一个对象的初始化完成,先行发生于它的finalizer
  8. 传递性(Transitivity):A先行发生于B,B先行发生于C,A先行发生于C

线程的实现

实现线程主要有3中方式:使用内核线程实现、使用用户线程实现和使用用户线程加轻量级进程混合实现。

  1. 使用内核线程实现 内核线程就是直接由操作系统内核(Kernel)支持的线程,这个线程由内核完成线程切换,内核通过操纵调度器(Schedule)对线程进行调度,并负责将线程的任务映射到各个处理器上。我们的程序一般不会直接使用内核线程,而是去使用内核线程的一种高级接口——轻量级进程,轻量级进程就是我们通常所说的线程。由于是基于内核线程实现的,所以各种线程操作(创建、析构、同步)都需要进行系统调用。而系统调用的代价较高,需要在用户态和内核态中来回切换。此外每个轻量级进程都需要一个内核线程的支持,因此一个系统支持轻量级进程的数量是有限的。
  2. 使用用户线程实现 从广义上说,一个线程不是内核线程就可以认为是用户线程。而狭义上的用户线程指的是完全建立在用户空间的线程库上,系统内核不能感知线程存在的实现。

线程调度

线程调度是指系统为线程分配处理器使用权的过程,主要调度方式有两种,分别是协同式线程调度和抢占式线程调度

线程状态切换

java定义了5种线程状态,在任意一个时间点,一个线程只能有且只有其中一中状态

  • new:创建后未执行;
  • runable:包括操作系统状态的running和ready;
  • waiting:无限期等待,处于这种状态的线程不会被分配cpu执行时间,Object.wait()、Thread.join()没有设置时间、LockSupport.park()方法;
  • Timed waiting:处于这种状态的线程不会被分配cpu执行时间,无需被其他线程唤醒,一定时间后会由系统唤醒。Object.wait()、Thread.join()设置时间、Thread.sleep()等。
  • blocked:阻塞状态,和waiting不同的是,blocked状态在等待获得一个排它锁,在一个线程放弃这个锁的时候发生。
  • Terminal:线程执行结束。