CAS、Sychronized、Valatile的底层原理详解

750 阅读5分钟

一、CAS

1.简介

CAS(Compare And Swap):从名字上看就知道什么意思了,比较并交换。

2.流程

3.JDK中的应用

在java.util.concurrent.atomic包下面,有许多的原子类,这里面的操作类型大多数与JAVA中基本类型的包装类对应。目的是为了防止高并发的情况下,各个线程操作产生错误数据。JDK中的一些无锁并发操作类是基于CAS相关操作。

源码追踪到最后的c++源码中,发现底层是lock comxchg指令,在汇编层面上,有lock前缀指令让CPU保证了数据的一致性,其他CPU不允许对里面的值进行修改。

二、Sychronized

1.内存模型

(1) 如何查看对象的内存模型?

OpenJDK,提供了JOL包,可以帮我们在运行时计算某个对象的大小,是非常好的工具。直接通过maven引入

        <dependency>
            <groupId>org.openjdk.jol</groupId>
            <artifactId>jol-core</artifactId>
            <version>0.9</version>
        </dependency>
import org.openjdk.jol.info.ClassLayout;
/**
 * @Author: lindongtian
 * @Description:
 * @Date: Create in  2020/6/11 9:29
 */
public class T {
    public static void main(String[] args) {
        Object o = new Object();
        System.out.println(ClassLayout.parseInstance(o).toPrintable());
    }
}
// 结果
java.lang.Object object internals:
 OFFSET  SIZE   TYPE DESCRIPTION                               VALUE
      0     4        (object header)                           01 00 00 00 (00000001 00000000 00000000 00000000) (1)
      4     4        (object header)                           00 00 00 00 (00000000 00000000 00000000 00000000) (0)
      8     4        (object header)                           e5 01 00 20 (11100101 00000001 00000000 00100000) (536871397)
     12     4        (loss due to the next object alignment)
Instance size: 16 bytes
Space losses: 0 bytes internal + 4 bytes external = 4 bytes total

可以看到 Object o = new Object();一共是16字节。

  • mardword(8字节) + class point(4字节:JVM默认开启压缩) + 对齐方式(4字节:为了读取效率高,默认为8的整数倍)

通过以上分析,我们可以知道一个普通对象包括了一下几个部分:

1、Sychronized的作用域

从上面我们知道了对象的组成,其中重点是markword:可以看到锁升级相关信息

首先,一个对象new出来时,锁状态为:

  • 无锁态
  • 有人使用了这个对象,锁状态变为偏向锁
  • 有其他线程与之争抢该资源, 诶?发现这个资源thread位置已经记录了一个线程id(加了偏向锁), 此时会升级为轻量级锁(也叫自旋锁,无锁):CAS实现
  • 当自旋线程过多(JVM会自适应),消耗CPU过多时,升级为重量级锁(以队列的形式,让现场等待,等待队列中的线程不消耗CPU)

因为markword包含了锁信息,所以这也是sychronized的作用域

通常说的通过synchronized实现的同步锁,也叫重量级锁。但是重量级锁会造成线程排队(串行执行),且会使CPU在用户态和核心态之间频繁切换,所以代价高、效率低。为了提高效率,不会一开始就使用重量级锁,JVM在内部会根据需要,进行锁的升级。

2.底层分析

(1) 通过查看字节码,可以看到Synchronized是如何实现对代码块进行同步的:

是通过指令monitorenter 和 monitorexit,关于这两条指令的作用,我们直接参考JVM规范中描述:

每个对象有一个监视器锁(monitor)。当monitor被占用时就会处于锁定状态,线程执行monitorenter指令时尝试获取monitor的所有权,过程如下:

  • 1、如果monitor的进入数为0,则该线程进入monitor,然后将进入数设置为1,该线程即为monitor的所有者。
  • 2、如果线程已经占有该monitor,只是重新进入,则进入monitor的进入数加1.
  • 3.如果其他线程已经占用了monitor,则该线程进入阻塞状态,直到monitor的进入数为0,再重新尝试获取monitor的所有权。

执行monitorexit的线程必须是objectref所对应的monitor的所有者。

  • 指令执行时,monitor的进入数减1,如果减1后进入数为0,那线程退出monitor,不再是这个monitor的所有者。其他被这个monitor阻塞的线程可以尝试去获取这个 monitor 的所有权。

  通过这两段描述,我们应该能很清楚的看出Synchronized的实现原理,Synchronized的语义底层是通过一个monitor的对象来完成,其实wait/notify等方法也依赖于monitor对象,这就是为什么只有在同步的块或者方法中才能调用wait/notify等方法,否则会抛出java.lang.IllegalMonitorStateException的异常的原因。
  
另一种方法的同步:

static synchronized void println(){
        System.out.println("hello java");
    }

方法的同步并没有通过指令monitorenter和monitorexit来完成(理论上其实也可以通过这两条指令来实现),不过相对于普通方法,其常量池中多了ACC_SYNCHRONIZED标示符。JVM就是根据该标示符来实现方法的同步的:当方法调用时,调用指令将会检查方法的 ACC_SYNCHRONIZED 访问标志是否被设置,如果设置了,执行线程将先获取monitor,获取成功之后才能执行方法体,方法执行完后再释放monitor。在方法执行期间,其他任何线程都无法再获得同一个monitor对象。 其实本质上没有区别,只是方法的同步是一种隐式的方式来实现,无需通过字节码来完成。

3、再追踪其底层

c++源码中最后也是lock指令

三、Valatile

1、作用

  • 禁止指令重排序
  • 保证可见性

2、底层

也是lock指令前缀