Java内存模型之可见性

1,122 阅读6分钟

一.代码演示可见性问题

1.1 代码演示

public class FieldVisibility {
	
     int a = 1;
     int b = 2;

    private void change() {
        a = 3;
        b = a;
    }

    private void print() {
        System.out.println("a=" + a + ";b=" + b);
    }

    public static void main(String[] args) {
        while (true) {
            FieldVisibility test = new FieldVisibility();
            //该线程负责改变a和b的值
            new Thread(new Runnable() {
                @Override
                public void run() {
                    try {
                        Thread.sleep(1);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                    test.change();
                }
            }).start();
			//该线程负责输出a和b的值
            new Thread(new Runnable() {
                @Override
                public void run() {
                    try {
                        Thread.sleep(1);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                    test.print();
                }
            }).start();
        }
    }
}

1.2 代码分析

提炼出关键代码开始分析

int a = 1;
int b = 2;

private void change() {
        a = 3;
        b = a;
    }

private void print() {
        System.out.println("a=" + a + ";b=" + b);
    }

输出有四种情况:
1.a=3;b=3 //A线程先执行完
2.a=1;b=2 //B线程先执行完
3.a=3;b=2 //A和B交替执行
4.a=1;b=3 //由于内存可见性问题,导致a被修改后没有即时刷新回主内存就被打印了

二.为什么会有可见性问题

  先来看一张CPU缓存的结构图:   高速缓存的容量比主内存小,但是速度仅次于寄存器,所以在CPU和主内存之间就多了Cache层。线程间的对于共享变量的可见性问题不是直接由多核引起的,而是由多缓存引起的。如果所有个核心都只用一个缓存,那么也就不存在内存可见性问题了。每个核心都会将自己需要的数据读到独占缓存中,数据修改后也是写入到缓存中,然后等待刷入到主存中。所以会导致有些核心读取的值是一个过期的值。

三.JMM的抽象:主内存和本地内存

  这两个其实是JMM里的概念,本地内存也叫工作内存。

3.1 什么是主内存和本地内存

  Java作为高级语言,屏蔽了CPU cache等底层细节,用 JMM 定义了一套读写内存数据的规范,虽然我们不再需要关心一级缓存和二级缓存的问题,但是,JMM 抽象了主内存和本地内存的概念。

3.2 主内存和本地内存的关系

四.happens-before原则(先行发生原则)

4.1 什么是happens-before

  Happens-Before规则最初是在一篇叫做《Time, Clocks, and the Ordering of Events in a Distributed System》的论文中提出来的,在这篇论文中,Happens-Before 的语义是一种因果关系。在现实世界里,如果 A 事件是导致 B 事件的起因,那么 A 事件一定是先于(Happens-Before)B 事件发生的,这个就是 Happens-Before 语义的现实理解。
  在 Java 语言里面,Happens-Before 的规则本质上是一种可见性,也就是为了解决可见性问题的。语义是:A Happens-Before B 意味着 A 事件对 B 事件来说是可见的,无论 A 事件和 B 事件是否发生在同一个线程里。例如 A 事件发生在线程 1 上,B 事件发生在线程 2 上,Happens-Before 规则保证线程 2 上也能看到 A 事件的发生。
  在时间上,动作A发生在动作B之前,B保证能看见A,这就是happens-before。它其实真正要表达的是:前面一个操作的结果对后续操作是可见的。 Happens-Before规则就是要保证线程之间的这种“心灵感应”。所以比较正式的说法是:Happens-Before约束了编译器的优化行为,虽允许编译器优化,但是要求编译器优化后一定遵守Happens-Before规则。

4.2 happens-before规则有哪些

  和程序员相关的规则一共有如下六项,都是关于可见性的。先来看一下来自《Java并发编程的艺术》的官方定义,再来逐条讲解: 先展示下示例代码:

1 class VolatileExample {
2  int x = 0;
3  volatile boolean v = false;
4  public void writer() {
5    x = 42;
6    v = true;
7  }
8  public void reader() {
9    if (v == true) {
10      // 输出x
11   }
12  }
13 }

4.2.1 程序的顺序性规则

  这条规则是指在一个线程中,按照程序顺序,前面的操作 Happens-Before 于后续的任意操作。这还是比较容易理解的,比如上面那段示例代码,按照程序的顺序,第 5 行代码 “x = 42;” Happens-Before 于第 6 行代码 “v = true;”,这就是规则 1 的内容,也比较符合单线程里面的思维:程序前面对某个变量的修改一定是对后续操作可见的。

4.2.2 volatile 变量规则

  volatile关键字并不是Java语言的特产,古老的 C 语言里也有,它最原始的意义就是禁用CPU缓存。由于在旧的Java内存模型中,虽然不允许volatile变量之间重排序,但旧的Java内存模型允许volatile变量与普通变量重排序。所以上面代码的第十行,低于1.5版本前x可能会是0,如果在1.5以上的版本上运行,x肯定等于42,因为Happens-Before对volatile的语义在1.5版本之后进行了增强。
  回归正题,这条规则是指对一个volatile变量的写操作,Happens-Before 于后续对这个volatile变量的读操作。貌似和1.5版本以前的语义没有变化,但是如果我们关联一下规则3,就有点不一样的感觉了。

4.2.3 传递性

  这条规则是指如果A Happens-Before B,且B Happens-Before C,那么A Happens-Before C。我们将规则3的传递性应用到我们的例子中,会发生什么呢?   从图中,我们可以看到:
  1.“x=42” Happens-Before 写变量 “v=true” ,这是规则1的内容;
  2.写变量“v=true” Happens-Before 读变量 “v=true”,这是规则2的内容 。
  再根据这个传递性规则,我们得到结果:“x=42” Happens-Before 读变量“v=true”。这意味着什么呢?
如果线程B读到了“v=true”,那么线程A设置的“x=42”对线程B是可见的。也就是说,线程B能看到 “x == 42” 。这就是1.5版本对 volatile语义的增强!!这个增强意义重大,1.5版本的并发工具包(java.util.concurrent)就是靠volatile语义来搞定可见性的。

4.2.4 锁操作(synchronized和Lock)的规则

  这条规则是指对一个锁的解锁 Happens-Before 于后续对这个锁的加锁。

synchronized (this) { //此处自动加锁
  // x是共享变量,初始值=10
  if (this.x < 12) {
    this.x = 12; 
  }  
} //此处自动解锁

  假设 x 的初始值是 10,线程 A 执行完代码块后 x 的值会变成 12(执行完自动释放锁),线程 B 进入代码块时,能够看到线程 A 对 x 的写操作,也就是线程 B 能够看到 x==12。这个也是符合我们直觉的,应该不难理解。

4.2.5 线程 start() 规则

  这条是关于线程启动的。它是指主线程 A 启动子线程 B 后,子线程 B 能够看到主线程在启动子线程 B 前的操作。换句话说就是,如果线程 A 调用线程 B 的 start() 方法(即在线程 A 中启动线程 B),那么该 start() 操作 Happens-Before 于线程 B 中的任意操作。

4.2.6 线程 join() 规则

  这条是关于线程等待的。它是指主线程 A 等待子线程 B 完成(主线程 A 通过调用子线程 B 的 join() 方法实现),当子线程 B 完成后(主线程 A 中 join() 方法返回),主线程能够看到子线程的操作。当然所谓的“看到”,指的是对共享变量的操作。换句话说就是,如果在线程 A 中,调用线程 B 的 join() 并成功返回,那么线程 B 中的任意操作 Happens-Before 于该 join() 操作的返回。

五.volatile关键字

5.1 volatile是什么

  volatile关键字的语义有两个保证变量的可见性和禁止指令重排序优化。

5.2 volatile适用的场合

5.2.1 boolean flag

  如果一个共享变量自始至终只被各个线程赋值,而没有其他的操作,那么就可以用volatile来代替synchronized或者代替原子变量,因为赋值自身是有原子性的,而volatile又保证了可见性,所以就足以保证线程安全。

public class UseVolatile1 implements Runnable {

    volatile boolean done = false;
    AtomicInteger realA = new AtomicInteger();

    public static void main(String[] args) throws InterruptedException {
        Runnable r =  new UseVolatile1();
        Thread thread1 = new Thread(r);
        Thread thread2 = new Thread(r);
        thread1.start();
        thread2.start();
        thread1.join();
        thread2.join();
        System.out.println(((UseVolatile1) r).done);
        System.out.println(((UseVolatile1) r).realA.get());
    }
    @Override
    public void run() {
        for (int i = 0; i < 10000; i++) {
            setDone();
            realA.incrementAndGet();
        }
    }

    private void setDone() {
        done = true;
    }
}
输出如下:
true
20000

5.2.2 作为刷新之间变量的触发器

  用了volatile int x后,可以保证读取x后,之前的所有变量都可见。

六.volatile的作用

6.3.1 可见性

  读一个volatile变量之前,需要先使相应的本地缓存失效,这样就必须到主内存读取最新值,写一个volatile属性会立即刷入到主内存。

6.3.2 禁止指令重排序优化

  在不希望编译器和CPU进行指令重排序时可以用volatile关键字,避免重排序导致的线程不安全的业务问题。

七. 对synchronized可见性的正确理解

  synchronized也可以达到同样的happens-before效果。这里关于synchronized有一个特别值得说的点,我们之前可能一致认为,使用了synchronized之后,synchronized会帮我们设立临界区,这样在一个线程操作数据的时候,另一个线程无法进来同时操作,所以保证了线程安全。其实这是不全面的,这种说法没有考虑到可见性问题。真正完整的说法是:synchronized不仅防止了一个线程在操作某对象时收到其他线程的干扰,同时还保证了修改好之后,可以立即被其他线程所看到。(因为如果其他线程看不到,那也会有线程安全问题)。






参考:
《深入理解计算机系统》
《深入理解Java虚拟机第三版》
《Java并发编程的艺术》
极客时间《Java并发编程实战》