「JUC篇」之 深度理解volatile与Java内存模型

80 阅读12分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 2 月更文挑战」的第 1 天,点击查看活动详情

觉得对你有益的小伙伴记得点个赞+关注

后续完整内容持续更新中

希望一起交流的欢迎发邮件至javalyhn@163.com

1. 被volatile修饰的变量有什么特点

  1. 可见性
  2. 有序性

volatile的内存语义:

  1. 当写一个volatile变量时,JMM会把该线程对应的本地内存中的共享变量值立即刷新回主内存中
  2. 当读一个volatile变量时,JMM会把该线程对应的本地内存设置为无效,直接从主内存中读取共享变量
  3. 所以volatile的写内存语义是直接刷新到主内存中,读的内存语义是直接从主内存中读取。

volatile为什么能保证可见性与有序性,内存屏障

2. 内存屏障

2.1 是什么

内存屏障(也称内存栅栏,内存栅障,屏障指令等,是一类同步屏障指令,是CPU或编译器在对内存随机访问的操作中的一个同步点,使得此点之前的所有读写操作都执行后才可以开始执行此点之后的操作),避免代码重排序。内存屏障其实就是一种JVM指令,Java内存模型的重排规则会要求Java编译器在生成JVM指令时插入特定的内存屏障指令,通过这些内存屏障指令,volatile实现了Java内存模型中的可见性和有序性但volatile无法保证原子性

内存屏障之前的所有写操作都要回写到主内存内存屏障之后的所有读操作都能获得内存屏障之前的所有写操作的最新结果(实现了可见性)。

image.png

因此重排序时,不允许把内存屏障之后的指令重排序到内存屏障之前。 一句话:对一个 volatile 域的写, happens-before 于任意后续对这个 volatile 域的读,也叫写后读

2.2 JVM中提供了四类内存屏障指令

happens-before先行发生原则是怎么落地实现的?

凭借内存屏障

下面我们追一下源码

Unsafe.class

image.png

Unsafe.java

image.png

Unsafe.cpp

image.png

OrderAccess.hpp

image.png

orderAccess_linux_x86.inline.hpp

image.png

2.3 四大屏障分别是什么意思

image.png

3. happens-before 之 volatile 变量规则

3.1 写

  1. 在每个 volatile 写操作的前⾯插⼊⼀个 StoreStore 屏障
  2. 在每个 volatile 写操作的后⾯插⼊⼀个 StoreLoad 屏障

image.png image.png

3.2 读

  1. 在每个 volatile 读操作的后⾯插⼊⼀个 LoadLoad 屏障
  2. 在每个 volatile 读操作的后⾯插⼊⼀个 LoadStore 屏障

image.png image.png

3.3 小总结

image.png

image.png

4. volatile可见性

4.1 保证可见性

保证不同线程对这个变量进行操作时的可见性,即变量一旦改变所有线程立即可见

  static          boolean flag = true;       //不加volatile,没有可见性
    //static volatile boolean flag = true;       //加了volatile,保证可见性

    public static void main(String[] args)
    {
        new Thread(() -> {
            System.out.println(Thread.currentThread().getName()+"\t come in");
            while (flag)
            {

            }
            System.out.println(Thread.currentThread().getName()+"\t flag被修改为false,退出.....");
        },"t1").start();

        //暂停2秒钟后让main线程修改flag值
        try { TimeUnit.SECONDS.sleep(2); } catch (InterruptedException e) { e.printStackTrace(); }

        flag = false;

        System.out.println("main线程修改完成");
    }

结论:不加volatile,没有可见性,程序无法停止 | 加了volatile,保证可见性,程序可以停止

4.2 线程t1中为何看不到被主线程main修改为false的flag的值?

  1. 问题可能

    • 主线程修改了flag之后没有将其刷新到主内存,所以t1线程看不到。
    • 主线程将flag刷新到了主内存,但是t1一直读取的是自己工作内存中flag的值,没有去主内存中更新获取flag最新的值。
  2. 我们的需求

    • 线程中修改了工作内存中的副本之后,立即将其刷新到主内存;
    • 工作内存中每次读取共享变量时,都去主内存中重新读取,然后拷贝到工作内存。
  3. 解决方案

    • 使用volatile修饰共享变量,就可以达到上面的效果,被volatile修改的变量有以下特点:
      • 线程中读取的时候,每次读取都会去主内存中读取共享变量最新的值,然后将其复制到工作内存
      • 线程中修改了工作内存中变量的副本,修改之后会立即刷新到主内存

4.3 volatile变量的读写过程

Java内存模型中定义的8种工作内存与主内存之间的原子操作 read(读取)→load(加载)→use(使用)→assign(赋值)→store(存储)→write(写入)→lock(锁定)→unlock(解锁)

image.png

read: 作用于主内存,将变量的值从主内存传输到工作内存,主内存到工作内存

load: 作用于工作内存,将read从主内存传输的变量值放入工作内存变量副本中,即数据加载

use: 作用于工作内存,将工作内存变量副本的值传递给执行引擎,每当JVM遇到需要该变量的字节码指令时会执行该操作

assign: 作用于工作内存,将从执行引擎接收到的值赋值给工作内存变量,每当JVM遇到一个给变量赋值字节码指令时会执行该操作

store: 作用于工作内存,将赋值完毕的工作变量的值写回给主内存

write: 作用于主内存,将store传输过来的变量值赋值给主内存中的变量

由于上述只能保证单条指令的原子性,针对多条指令的组合性原子保证,没有大面积加锁,所以,JVM提供了另外两个原子指令:

lock: 作用于主内存,将一个变量标记为一个线程独占的状态,只是写时候加锁,就只是锁了写变量的过程。

unlock: 作用于主内存,把一个处于锁定状态的变量释放,然后才能被其他线程占用

5. volatile没有原子性

volatile变量的复合操作(如i++)不具有原子性

class MyNumber
{
    volatile int number = 0;

    public void addPlusPlus()
    {
        number++;
    }
}

public class VolatileNoAtomicDemo
{
    public static void main(String[] args) throws InterruptedException
    {
        MyNumber myNumber = new MyNumber();

        for (int i = 1; i <=10; i++) {
            new Thread(() -> {
                for (int j = 1; j <= 1000; j++) {
                    myNumber.addPlusPlus();
                }
            },String.valueOf(i)).start();
        }
        
        //暂停几秒钟线程
        try { TimeUnit.SECONDS.sleep(3); } catch (InterruptedException e) { e.printStackTrace(); }
        System.out.println(Thread.currentThread().getName() + "\t" + myNumber.number);
    }
}

image.png

执行了1w次但是结果却达不到,可见出现了并发问题,因此volatile不保证原子性

5.1 没有原子性原因分析

从i++字节码角度出发

image.png

原子性指的是一个操作是不可中断的,即使是在多线程环境下,一个操作一旦开始就不会被其他线程影响。

public void add()
{
        i++; //不具备原子性,该操作是`先读取值,然后写回一个新值,相当于原来的值加上1,分3步完成`
 }

如果第二个线程在第一个线程读取旧值和写回新值期间读取i的域值,那么第二个线程就会与第一个线程一起看到同一个值, 并执行相同值的加1操作,这也就造成了线程安全失败,因此对于add方法必须使用synchronized修饰,以便保证线程安全。

image.png

多线程环境下,"数据计算"和"数据赋值"操作可能多次出现,即操作非原子。若数据在加载之后,若主内存count变量发生修改之后,由于线程工作内存中的值在此前已经加载,从而不会对变更操作做出相应变化,即私有内存和公共内存中变量不同步,进而导致数据不一致

对于volatile变量,JVM只是保证从主内存加载到线程工作内存的值是最新的,也就是数据加载时是最新的

由此可见volatile解决的是变量读时的可见性问题,但无法保证原子性,对于多线程修改共享变量的场景必须使用加锁同步

如果是对一个普通变量进行读写情况呢

当线程1对主内存对象发起read操作到write操作第一套流程的时间里,线程2随时都有可能对这个主内存对象发起第二套操作

image.png

5.2 既然一修改就是可见,为什么还不能保证原子性?

volatile主要是对其中部分指令做了处理

image.png

要use(使用)一个变量的时候必需load(载入),要载入的时候必需从主内存read(读取)这样就解决了读的可见性。

写操作是把assign和store做了关联(在assign(赋值)后必需store(存储))。store(存储)后write(写入)。 也就是做到了给一个变量赋值的时候一串关联指令直接把变量值写到主内存。

就这样通过用的时候直接从主内存取,在赋值到直接写回主内存做到了内存可见性。

但是!!注意蓝色框框的间隙

image.png

蓝框部分不是原子性的,也就是在use后把工作内存中的变量交给执行引擎到执行引擎赋值执行assign这个过程不是原子性的。

结论

image.png

read-load-useassign-store-write 成为了两个不可分割的原子操作,但是在use和assign之间依然有极小的一段真空期,有可能变量会被其他线程读取,导致写丢失一次..

但是无论在哪一个时间点主内存的变量和任一工作内存的变量的值都是相等的。这个特性就导致了volatile变量不适合参与到依赖当前值的运算,如i = i + 1; i++;之类的。

那么依靠可见性的特点volatile可以用在哪些地方呢? 通常volatile用做保存某个状态的boolean值or int值

image.png

5.3 面试回答

JVM的字节码,i++分成三步,间隙期不同步非原子操作(i++)

image.png

6. volatile指令禁重排

6.1 重排序

重排序是指编译器和处理器为了优化程序性能而对指令序列进行重新排序的一种手段,有时候会改变程序语句的先后顺序

不存在数据依赖关系,可以重排序;

存在数据依赖关系,禁止重排序

但重排后的指令绝对不能改变原有的串行语义!这点在并发设计中必须要重点考虑!

6.2 重排序的分类和执行流程

image.png

编译器优化的重排序: 编译器在不改变单线程串行语义的前提下,可以重新调整指令的执行顺序

指令级并行的重排序: 处理器使用指令级并行技术来讲多条指令重叠执行,若不存在数据依赖性,处理器可以改变语句对应机器指令的执行顺序

内存系统的重排序: 由于处理器使用缓存和读/写缓冲区,这使得加载和存储操作看上去可能是乱序执行

数据依赖性:若两个操作访问同一变量,且这两个操作中有一个为写操作,此时两操作间就存在数据依赖性。

6.3 案例

不存在数据依赖关系,可以重排序===> 重排序OK

image.png

存在数据依赖关系,禁止重排序===> 重排序发生,会导致程序运行结果不同

编译器和处理器在重排序时,会遵守数据依赖性,不会改变存在依赖关系的两个操作的执行,但不同处理器和不同线程之间的数据性不会被编译器和处理器考虑,其只会作用于单处理器和单线程环境,下面三种情况,只要重排序两个操作的执行顺序,程序的执行结果就会被改变。

image.png

6.4 volatile的底层实现是通过内存屏障

image.png

image.png

四大屏障的插入情况

  1. 在每一个volatile写操作前面插入一个StoreStore屏障 StoreStore屏障可以保证在volatile写之前,其前面的所有普通写操作都已经刷新到主内存中。
  2. 在每一个volatile写操作后面插入一个StoreLoad屏障 StoreLoad屏障的作用是避免volatile写与后面可能有的volatile读/写操作重排序
  3. 在每一个volatile读操作后面插入一个LoadLoad屏障 LoadLoad屏障用来禁止处理器把上面的volatile读与下面的普通读重排序。
  4. 在每一个volatile读操作后面插入一个LoadStore屏障 LoadStore屏障用来禁止处理器把上面的volatile读与下面的普通写重排序。
//模拟一个单线程,什么顺序读?什么顺序写?
public class VolatileTest {
    int i = 0;
    volatile boolean flag = false;
    public void write(){
        i = 2;
        flag = true;
    }
    public void read(){
        if(flag){
            System.out.println("---i = " + i);
        }
    }
}

image.png

7. 如何正确使用volatile

7.1 单一赋值可以,但是含复合运算赋值不可以(i++之类)

volatile int a = 10

volatile boolean flag = false

7.2 状态标志,判断业务是否结束

 private volatile static boolean flag = true;

    public static void main(String[] args)
    {
        new Thread(() -> {
            while(flag) {
                //do something......
            }
        },"t1").start();

        //暂停几秒钟线程
        try { TimeUnit.SECONDS.sleep(2L); } catch (InterruptedException e) { e.printStackTrace(); }

        new Thread(() -> {
            flag = false;
        },"t2").start();
    }

7.3 开销较低的读,写锁策略

 /**
     * 使用:当读远多于写,结合使用内部锁和 volatile 变量来减少同步的开销
     * 理由:利用volatile保证读取操作的可见性;利用synchronized保证复合操作的原子性
     */
    public class Counter
    {
        private volatile int value;

        public int getValue()
        {
            return value;   //利用volatile保证读取操作的可见性
              }
        public synchronized int increment()
        {
            return value++; //利用synchronized保证复合操作的原子性
               }
    }

7.4 DCL双端锁的发布

先来看一段问题代码

 private static SafeDoubleCheckSingleton singleton;
    //私有化构造方法
    private SafeDoubleCheckSingleton(){
    }
    //双重锁设计
    public static SafeDoubleCheckSingleton getInstance(){
        if (singleton == null){
            //1.多线程并发创建对象时,会通过加锁保证只有一个线程能创建对象
            synchronized (SafeDoubleCheckSingleton.class){
                if (singleton == null){
                    //隐患:多线程环境下,由于重排序,该对象可能还未完成初始化就被其他线程读取
                    singleton = new SafeDoubleCheckSingleton();
                }
            }
        }
        //2.对象创建完毕,执行getInstance()将不需要获取锁,直接返回创建对象
        return singleton;
    }

单线程环境下(或者说正常情况下),在"问题代码处",会执行如下操作,保证能获取到已完成初始化的实例

image.png

由于存在指令重排序......

多线程看问题代码 隐患:多线程环境下,在"问题代码处",会执行如下操作,由于重排序导致2,3乱序,后果就是其他线程得到的是null而不是完成初始化的对象

image.png

解决方案1:加volatile修饰

 //通过volatile声明,实现线程安全的延迟初始化。
    private volatile static SafeDoubleCheckSingleton singleton;
    //私有化构造方法
    private SafeDoubleCheckSingleton(){
    }
    //双重锁设计
    public static SafeDoubleCheckSingleton getInstance(){
        if (singleton == null){
            //1.多线程并发创建对象时,会通过加锁保证只有一个线程能创建对象
            synchronized (SafeDoubleCheckSingleton.class){
                if (singleton == null){
                    //隐患:多线程环境下,由于重排序,该对象可能还未完成初始化就被其他线程读取
                                      //原理:利用volatile,禁止 "初始化对象"(2) 和 "设置singleton指向内存空间"(3) 的重排序
                    singleton = new SafeDoubleCheckSingleton();
                }
            }
        }
        //2.对象创建完毕,执行getInstance()将不需要获取锁,直接返回创建对象
        return singleton;
    }

面试题,反周志明老师的案例,你还有不加volatile的方法吗

解决方案2:采用静态内部类的方式实现

//现在比较好的做法就是采用静态内部内的方式实现

 private SingletonDemo() { }

    private static class SingletonDemoHandler
    {
        private static SingletonDemo instance = new SingletonDemo();
    }

    public static SingletonDemo getInstance()
    {
        return SingletonDemoHandler.instance;
    }

8. 总结

8.1 内存屏障是什么

image.png

8.2 内存屏障能干嘛

  1. 阻止屏障两边的指令重排序
  2. 写数据时加入屏障,强制将线程私有工作内存的数据刷回主物理内存
  3. 读数据时加入屏障,线程私有工作内存的数据失效,重新到主物理内存中获取最新数据

8.3 内存屏障四大指令

  1. 在每一个volatile写操作前面插入一个StoreStore屏障

image.png

  1. 在每一个volatile写操作后面插入一个StoreLoad屏障

image.png

  1. 在每一个volatile读操作后面插入一个LoadLoad屏障

image.png

  1. 在每一个volatile读操作后面插入一个LoadStore屏障

image.png

8.4 凭什么我们java写了一个volatile关键字,系统底层加入内存屏障?两者关系怎么勾搭上的?

字节码层面

image.png

image.png

8.5 volatile可见性

image.png

8.6 volatile禁重排

  1. 写指令

image.png

  1. 读指令

image.png

8.7 对比java.util.concurrent.locks.Lock来理解

image.png

8.8 终章总结

image.png