相比Sychronized(重量级锁，对系统性能影响较大)，volatile提供了另一种解决可见性和有序性问题的方案。

带着BAT大厂的面试问题去理解volatile

volatile关键字的作用是什么?
volatile能保证原子性吗?
之前32位机器上共享的long和double变量的为什么要用volatile? 现在64位机器上是否也要设置呢?
i++为什么不能保证原子性?
volatile是如何实现可见性的? 内存屏障。
volatile是如何实现有序性的? happens-before等
说下volatile的应用场景?

volatile的作用详解

防重排序

我们从一个最经典的例子来分析重排序问题。大家应该都很熟悉单例模式的实现，而在并发环境下的单例实现方式，我们通常可以采用双重检查加锁(DCL)的方式来实现。其源码如下：

public class Singleton { 
    public static volatile Singleton singleton; 
    /** 
    * 构造函数私有，禁止外部实例化 
    */ 
    private Singleton() {}; 
    public static Singleton getInstance() { 
        if (singleton == null) { 
            synchronized (singleton.class) { 
                if (singleton == null) { 
                    singleton = new Singleton(); 
                } 
            } 
        } 
        return singleton; 
    } 
}

现在我们分析一下为什么要在变量singleton之间加上volatile关键字。要理解这个问题，先要了解对象的构造过程，实例化一个对象其实可以分为三个步骤：

分配内存空间。
初始化对象。
将内存空间的地址赋值给对应的引用。
但是由于操作系统可以对指令进行重排序，所以上面的过程也可能会变成如下过程：
分配内存空间。
将内存空间的地址赋值给对应的引用。
初始化对象
如果是这个流程，多线程环境下就可能将一个未初始化的对象引用暴露出来，从而导致不可预料的结果。因此，为了防止这个过程的重排序，我们需要将变量设置为volatile类型的变量。

实现可见性

可见性问题主要指一个线程修改了共享变量值，而另一个线程却看不到。引起可见性问题的主要原因是每个线程拥有自己的一个高速缓存区——线程工作内存。volatile关键字能有效的解决这个问题，我们看下下面的例子，就可以知道其作用：

public class VolatileTest { 
    int a = 1; 
    int b = 2; 
    public void change(){ 
        a = 3; 
        b = a; 
    } 
    public void print(){ 
        System.out.println("b="+b+";a="+a); 
    } 
    public static void main(String[] args) { 
        while (true){ 
            final VolatileTest test = new VolatileTest(); 
            new Thread(new Runnable() { 
                @Override 
                public void run() { 
                    try { 
                        Thread.sleep(10); 
                    } catch (InterruptedException e) { 
                        e.printStackTrace(); 
                    } 
                    test.change(); 
                } 
            }).start(); 
            new Thread(new Runnable() { 
                @Override 
                public void run() { 
                    try { 
                        Thread.sleep(10); 
                    } catch (InterruptedException e) { 
                        e.printStackTrace(); 
                    } 
                    test.print(); 
                } 
            }).start(); 
        } 
    } 
}

直观上说，这段代码的结果只可能有两种：b=3;a=3 或 b=2;a=1。不过运行上面的代码(可能时间上要长一点)，你会发现除了上两种结果之外，还出现了另外两种结果：

...... 
b=2;a=1 
b=2;a=1 
b=3;a=3 
b=3;a=3 
b=3;a=1 // 这里 
b=3;a=3 
b=2;a=1 
b=3;a=3 
b=3;a=3 
b=2;a=3 // 这里 
......

为什么会出现b=2;a=3和b=3;a=1这种结果呢? 正常情况下，如果先执行change方法，再执行print方法，输出结果应该为b=3;a=3。相反，如果先执行的print方法，再执行change方法，结果应该是 b=2;a=1。那b=3;a=1的结果是怎么出来的? 原因就是第一个线程将值a=3修改后，但是对第二个线程是不可见的，所以才出现这一结果。如果将a和b都改成volatile类型的变量再执行，则再也不会出现b=2;a=3和b=3;a=1的结果了。

保证原子性:单次读/写

volatile不能保证完全的原子性，只能保证单次的读/写操作具有原子性。先从如下两个问题来理解（后文再从内存屏障的角度理解）：

问题1： i++为什么不能保证原子性?

对于原子性，需要强调一点，也是大家容易误解的一点：对volatile变量的单次读/写操作可以保证原子性的，如long和double类型变量，但是并不能保证i++这种操作的原子性，因为本质上i++是读、写两次操作。
现在我们就通过下列程序来演示一下这个问题：

public class VolatileTest01 { 
    volatile int i; 
    public void addI(){ 
        i++; 
    } 
    public static void main(String[] args) throws InterruptedException { 
        final VolatileTest01 test01 = new VolatileTest01(); 
        for (int n = 0; n < 1000; n++) { 
            new Thread(new Runnable() { 
                @Override 
                public void run() { 
                    try { 
                        Thread.sleep(10); 
                    } catch (InterruptedException e) { 
                        e.printStackTrace(); 
                    } 
                    test01.addI(); 
                } 
            }).start(); 
        } 
        Thread.sleep(10000);//等待10秒，保证上面程序执行完成 
        System.out.println(test01.i); 
    } 
}

大家可能会误认为对变量i加上关键字volatile后，这段程序就是线程安全的。大家可以尝试运行上面的程序。下面是我本地运行的结果：981 可能每个人运行的结果不相同。不过应该能看出，volatile是无法保证原子性的(否则结果应该是1000)。原因也很简单，i++其实是一个复合操作，包括三步骤：

读取i的值。
对i加1。
将i的值写回内存。 volatile是无法保证这三个操作是具有原子性的，我们可以通过AtomicInteger或者Synchronized来保证+1操作的原子性。
注：上面几段代码中多处执行了Thread.sleep()方法，目的是为了增加并发问题的产生几率，无其他作用。

问题2：共享的long和double变量的为什么要用volatile?

因为long和double两种数据类型的操作可分为高32位和低32位两部分，因此普通的long或double类型读/写可能不是原子的。因此，鼓励大家将共享的long和double变量设置为volatile类型，这样能保证任何情况下对long和double的单次读/写操作都具有原子性。
目前各种平台下的商用虚拟机都选择把 64 位数据的读写操作作为原子操作来对待，因此我们在编写代码时一般不把long 和 double 变量专门声明为 volatile多数情况下也是不会错的。

volatile 的实现原理

volatile 可见性实现

volatile 变量的内存可见性是基于内存屏障(Memory Barrier)实现:

内存屏障，又称内存栅栏，是一个CPU指令。
在程序运行时，为了提高执行性能，编译器和处理器会对指令进行重排序，JMM为了保证在不同的编译器和CPU上有相同的结果，通过插入特定类型的内存屏障来禁止特定类型的编译器重排序和处理器重排序，插入一条内存屏障会告诉编译器和CPU：不管什么指令都不能和这条Memory Barrier指令重排序。
写一段简单的Java代码，声明一个volatile变量，并赋值。

public class Test { 
    private volatile int a; 
    public void update() { 
        a = 1; 
    } 
    public static void main(String[] args) { 
        Test test = new Test(); 
        test.update(); 
    } 
}

通过 hsdis 和 jitwatch 工具可以得到编译后的汇编代码:

...... 
0x0000000002951563: and $0xffffffffffffff87,%rdi 
0x0000000002951567: je 0x00000000029515f8 
0x000000000295156d: test $0x7,%rdi 
0x0000000002951574: jne 0x00000000029515bd 
0x0000000002951576: test $0x300,%rdi 
0x000000000295157d: jne 0x000000000295159c 
0x000000000295157f: and $0x37f,%rax 
0x0000000002951586: mov %rax,%rdi 
0x0000000002951589: or %r15,%rdi 
0x000000000295158c: lock cmpxchg %rdi,(%rdx) //在 volatile 修饰的共享变量进行写操作的时候会多出 lock 前缀的指令 
0x0000000002951591: jne 0x0000000002951a15 
0x0000000002951597: jmpq 0x00000000029515f8 
0x000000000295159c: mov 0x8(%rdx),%edi 
0x000000000295159f: shl $0x3,%rdi 
0x00000000029515a3: mov 0xa8(%rdi),%rdi 
0x00000000029515aa: or %r15,%rdi 
......

lock前缀的指令在多核处理器下会引发两件事情:

将当前处理器缓存行的数据写回到系统内存。
写回内存的操作会使在其他CPU里缓存了该内存地址的数据无效。
为了提高处理速度，处理器不直接和内存进行通信，而是先将系统内存的数据读到内部缓存(L1，L2或其他)后再进行操作，但操作完不知道何时会写到内存。
如果对声明了volatile的变量进行写操作，JVM就会向处理器发送一条lock前缀的指令，将这个变量所在缓存行的数据写回到系统内存。
为了保证各个处理器的缓存是一致的，实现了缓存一致性协议(MESI)，每个处理器通过嗅探在总线上传播的数据来检查自己缓存的值是不是过期了，当处理器发现自己缓存行对应的内存地址被修改，就会将当前处理器的缓存行设置成无效状态，当处理器对这个数据进行修改操作的时候，会重新从系统内存中把数据读到处理器缓存里。
所有多核处理器下还会完成：当处理器发现本地缓存失效后，就会从内存中重读该变量数据，即可以获取当前最新值。
volatile变量通过这样的机制就使得每个线程都能获得该变量的最新值。

lock指令

在Pentium和早期的IA-32处理器中，lock前缀会使处理器执行当前指令时产生一个LOCK#信号，会对总线进行锁定，其它CPU对内存的读写请求都会被阻塞，直到锁释放。后来的处理器，加锁操作是由高速缓存锁代替总线锁来处理。因为锁总线的开销比较大，锁总线期间其他CPU没法访问内存。这种场景多缓存的数据一致通过缓存一致性协议(MESI)来保证。

缓存一致性

缓存是分段(line)的，一个段对应一块存储空间，称之为缓存行，它是CPU缓存中可分配的最小存储单元，大小32字节、64字节、128字节不等，这与CPU架构有关，通常来说是64字节。LOCK#因为锁总线效率太低，因此使用了多组缓存。为了使其行为看起来如同一组缓存那样。因而设计了缓存一致性协议。缓存一致性协议有多种，但是日常处理的大多数计算机设备都属于"嗅探(snooping)"协议。所有内存的传输都发生在一条共享的总线上，而所有的处理器都能看到这条总线。缓存本身是独立的，但是内存是共享资源，所有的内存访问都要经过仲裁(同一个指令周期中，只有一个CPU缓存可以读写内存)。CPU缓存不仅仅在做内存传输的时候才与总线打交道，而是不停在嗅探总线上发生的数据交换，跟踪其他缓存在做什么。当一个缓存代表它所属的处理器去读写内存时，其它处理器都会得到通知，它们以此来使自己的缓存保持同步。只要某个处理器写内存，其它处理器马上知道这块内存在它们的缓存段中已经失效。

volatile有序性实现

volatile的happens-before关系

happens-before规则中有一条是volatile变量规则：对一个volatile域的写，happens-before于任意后续对这个volatile域的读。

//假设线程A执行writer方法，线程B执行reader方法 
class VolatileExample { 
    int a = 0; 
    volatile boolean flag = false; 
    public void writer() { 
        a = 1; // 1 线程A修改共享变量 
        flag = true; // 2 线程A写volatile变量 
    } 
    public void reader() { 
        if (flag) { // 3 线程B读同一个volatile变量 
        int i = a; // 4 线程B读共享变量 …… 
        } 
    } 
}

根据happens-before规则，上面过程会建立3类happens-before关系。

根据程序次序规则：1 happens-before 2且3 happens-before 4。
根据volatile规则：2 happens-before 3。
根据happens-before的传递性规则：1 happens-before 4。因为以上规则，当线程A将volatile变量flag更改为true后，线程B能够迅速感知。

volatile禁止重排序

为了性能优化，JMM在不改变正确语义的前提下，会允许编译器和处理器对指令序列进行重排序。JMM提供了内存屏障阻止这种重排序。
Java编译器会在生成指令系列时在适当的位置会插入内存屏障指令来禁止特定类型的处理器重排序。
JMM会针对编译器制定volatile重排序规则表。 "NO"表示禁止重排序。
为了实现volatile内存语义时，编译器在生成字节码时，会在指令序列中插入内存屏障来禁止特定类型的处理器重排序。对于编译器来说，发现一个最优布置来最小化插入屏障的总数几乎是不可能的，为此，JMM采取了保守的策略。

在每个volatile写操作的前面插入一个StoreStore屏障。
在每个volatile写操作的后面插入一个StoreLoad屏障。
在每个volatile读操作的后面插入一个LoadLoad屏障。
在每个volatile读操作的后面插入一个LoadStore屏障。
volatile写是在前面和后面分别插入内存屏障，而volatile读操作是在后面插入两个内存屏障。 | 内存屏障 | 说明 | | --- | --- | | StoreStore屏障 | 禁止上面的普通写和下面的volatile写重排序。 | | StoreLoad屏障 | 防止上面的volatile写与下面可能有的volatile读/写重排序。 | | LoadLoad屏障 | 禁止下面所有的普通读操作和上面的volatile读重排序。 | | LoadStore屏障 | 禁止下面所有的普通写操作和上面的volatile读重排序。 |

volatile的应用场景

使用volatile必须具备的条件

对变量的写操作不依赖于当前值。
该变量没有包含在具有其他变量的不变式中。
只有在状态真正独立于程序内其他内容时才能使用 volatile。

模式1：状态标志

也许实现volatile变量的规范使用仅仅是使用一个布尔状态标志，用于指示发生了一个重要的一次性事件，例如完成初始化或请求停机。

volatile boolean shutdownRequested; 
...... 
public void shutdown() { 
    shutdownRequested = true; 
} 
public void doWork() { 
    while (!shutdownRequested) { 
        // do stuff 
    } 
}

模式2：一次性安全发布(one-time safe publication)

缺乏同步会导致无法实现可见性，这使得确定何时写入对象引用而不是原始值变得更加困难。在缺乏同步的情况下，可能会遇到某个对象引用的更新值(由另一个线程写入)和该对象状态的旧值同时存在。(这就是造成著名的双重检查锁定(double-checked-locking)问题的根源，其中对象引用在没有同步的情况下进行读操作，产生的问题是您可能会看到一个更新的引用，但是仍然会通过该引用看到不完全构造的对象)。
实现安全发布对象的一种技术就是将对象引用定义为volatile类型。其他代码在能够利用这些数据时，在使用之前将检查这些数据是否曾经发布过。
如果theFlooble引用不是volatile类型，doWork()中的代码在解除对theFlooble的引用时，将会得到一个不完全构造的Flooble。
该模式的一个必要条件是：被发布的对象必须是线程安全的，或者是有效的不可变对象（有效不可变意味着对象的状态在发布之后永远不会被修改）。volatile类型的引用可以确保对象的发布形式的可见性，但是如果对象的状态在发布后将发生更改，那么就需要额外的同步。

public class BackgroundFloobleLoader { 
    public volatile Flooble theFlooble; 
    public void initInBackground() { 
        // do lots of stuff 
        theFlooble = new Flooble(); // this is the only write to theFlooble 
    } 
} 
public class SomeOtherClass { 
    public void doWork() { 
        while (true) { 
            // do some stuff... 
            // use the Flooble, but only if it is ready 
            if (floobleLoader.theFlooble != null) 
                doSomething(floobleLoader.theFlooble); 
        } 
    } 
}

模式3：独立观察(independent observation)

安全使用volatile的另一种简单模式是定期发布观察结果供程序内部使用。例如，假设有一种环境传感器能够感觉环境温度。一个后台线程可能会每隔几秒读取一次该传感器，并更新包含当前文档的volatile变量。然后，其他线程可以读取这个变量，从而随时能够看到最新的温度值。

public class UserManager { 
    public volatile String lastUser; 
    public boolean authenticate(String user, String password) { 
        boolean valid = passwordIsValid(user, password); 
        if (valid) { 
            User u = new User(); 
            activeUsers.add(u); 
            lastUser = user; 
        } 
        return valid; 
    } 
}

模式4：volatile bean模式

在volatile bean模式中，JavaBean的所有数据成员都是volatile类型的，并且getter和setter方法必须非常普通——除了获取或设置相应的属性外，不能包含任何逻辑。此外，对于对象引用的数据成员，引用的对象必须是有效不可变的。(这将禁止具有数组值的属性，因为当数组引用被声明为volatile时，只有引用而不是数组本身具有volatile语义)。对于任何volatile变量，不变式或约束都不能包含JavaBean属性。

@ThreadSafe 
public class Person { 
private volatile String firstName; 
private volatile String lastName; 
private volatile int age; 
public String getFirstName() { return firstName; } 
public String getLastName() { return lastName; } 
public int getAge() { return age; } 
public void setFirstName(String firstName) { this.firstName = firstName; } 
public void setLastName(String lastName) { this.lastName = lastName; } 
public void setAge(int age) { this.age = age; } 
}

模式5：开销较低的读－写锁策略

volatile的功能还不足以实现计数器。因为++x实际上是三种操作(读、添加、存储)的简单组合，如果多个线程凑巧试图同时对volatile计数器执行增量操作，那么它的更新值有可能会丢失。如果读操作远远超过写操作，可以结合使用内部锁和volatile变量来减少公共代码路径的开销。安全的计数器使用synchronized确保增量操作是原子的，并使用volatile保证当前结果的可见性。如果更新不频繁的话，该方法可实现更好的性能，因为读路径的开销仅仅涉及volatile读操作，这通常要优于一个无竞争的锁获取的开销。

@ThreadSafe 
public class CheesyCounter { 
    // Employs the cheap read-write lock trick 
    // All mutative operations MUST be done with the 'this' lock held 
    @GuardedBy("this") private volatile int value; 
    public int getValue() { return value; } 
    public synchronized int increment() { 
        return value++; 
    } 
}

模式6：双重检查(double-checked)

单例模式的一种实现方式，但很多人会忽略volatile关键字，因为没有该关键字，程序也可以很好的运行，只不过代码的稳定性总不是100%，说不定在未来的某个时刻，隐藏的bug就出来了。

class Singleton { 
private volatile static Singleton instance; 
    private Singleton() { } 
    public static Singleton getInstance() { 
        if (instance == null) { 
            syschronized(Singleton.class) { 
                if (instance == null) { 
                    instance = new Singleton(); 
                } 
            } 
        } 
        return instance; 
    } 
}

关键字: volatile详解