线程安全

66 阅读42分钟

1 概述

在软件业发展的初期,程序编写都是以算法为核心的

  • 程序员会把数据和过程分别作为独立的部分来考虑,数据代表问题空间中的客体,程序代码则用于处理这些数据,这种思维方式直接站在计算机的角度去抽象问题和解决问题,被称为面向过程的编程思想。
  • 面向对象的编程思想则站在现实世界的角度去抽象和解决问题,它把数据和行为都看作对象的一部分,这样可以让程序员能以符合现实世界的思维方式来编写和组织程序。

面向对象的编程思想极大地提升了现代软件开发的效率和软件可以达到的规模,但是现实世界与计算机世界之间不可避免地存在一些差异。例如,人们很难想象现实中的对象在一项工作进行期间,会被不停地中断和切换,对象的属性(数据)可能会在中断期间被修改和变脏,而这些事件在计算机世界中是再普通不过的事情。

2 线程安全

线程安全:当多个线程同时访问一个对象时,如果不用考虑这些线程在运行时环境下的调度和交替执行,也不需要进行额外的同步,或者在调用方进行任何其他的协调操作,调用这个对象的行为都可以获得正确的结果,那就称这个对象是线程安全的。”

这句话怎么理解呢?

  • 当多个线程同时访问一个对象时:在多线程编程中,不同的线程可能会同时尝试访问和修改同一个对象或其成员变量。
  • 如果不用考虑这些线程在运行时环境下的调度和交替执行:这意味着即使线程的执行顺序不可预测(由操作系统或JVM调度),对象的内部状态也不会因此而出错。
  • 也不需要进行额外的同步,或者在调用方进行任何其他的协调操作:在多线程环境中,当多个线程试图访问或修改同一份共享资源时,如果不加以控制,很容易产生竞态条件或数据不一致性问题。为了避免这些问题,通常会采用同步机制,比如锁(Locks)、信号量(Semaphores)、管程(Monitors)等,来确保同一时间只有一个线程可以访问共享资源。然而,如果一个对象被设计成“线程安全”的,那么它本身就包含了必要的同步逻辑,以防止多线程访问时可能出现的问题。这意味着在使用这类对象时,你不需要自己去添加额外的同步代码(例如,手动加锁和解锁)。对象的设计已经确保了在多线程环境下,即使没有外部同步机制,也能保持数据的完整性和一致性。
  • 调用这个对象的行为都可以获得正确的结果:无论多少线程同时访问,对象都能保证其行为的正确性,即不会出现数据混乱、丢失更新等问题。

“线程安全”意味着一个对象可以在多线程环境中被安全地使用,无需担心数据不一致或竞态条件,也不需要额外的同步措施。这种特性通常通过设计良好的内部锁机制、原子操作、不可变性或其他并发控制策略来实现。

一个对象或一段代码在多线程环境下能够被多个线程同时访问而不会产生数据不一致或者错误行为的特性。如果一个类或方法声明自己是线程安全的,那么它应该能够承受多个线程的并发访问,而不需要外部同步机制的介入

2.1 Java语言中的线程安全

在Java语言中,线程安全具体是如何体现的?有哪些操作是线程安全的?我们这里讨论的线程安全,将以多个线程之间存在共享数据访问为前提。因为如果根本不存在多线程,又或者一段代码根本不会与其他线程共享数据,那么从线程安全的角度上看,程序是串行执行还是多线程执行对它来说是没有什么区别的。

只有共享变量才会被多个线程访问,才会存在线程安全问题。因为只有成员变量才会存在于堆上,局部变量只会在栈上

线程安全问题通常与共享变量相关联,特别是那些存储在堆上的成员变量(包括静态变量和实例变量),因为这些变量可以被多个线程访问和修改。当多个线程尝试同时访问和修改同一个共享变量时,如果没有适当的同步机制,就可能发生数据不一致、竞态条件或死锁等问题。

局部变量,包括方法参数和在方法体内部声明的变量,它们存储在调用该方法的线程的栈中,因此每个线程都有自己独立的副本。这意味着局部变量不会被多个线程共享,因此不会直接引起线程安全问题。但是,如果一个局部变量引用了一个对象,而这个对象的成员变量是共享的,那么通过这个局部变量引用对对象的成员变量的操作仍然可能引发线程安全问题。

为了更深入地理解线程安全,在这里我们可以不把线程安全当作一个非真即假的二元排他选项来看待,而是按照线程安全的“安全程度”由强至弱来排序,我们可以将Java语言中各种操作共享的数据分为以下五类:不可变、绝对线程安全、相对线程安全、线程兼容和线程对立。

1.不可变

在Java语言里面(特指JDK 5以后,即Java内存模型被修正之后的Java语言),不可变(Immutable)的对象一定是线程安全的,无论是对象的方法实现还是方法的调用者,都不需要再进行任何线程安全保障措施。只要一个不可变的对象被正确地构建出来(即没有发生this引用逃逸的情况),那其外部的可见状态永远都不会改变,永远都不会看到它在多个线程之中处于不一致的状态。“不可变”带来的安全性是最直接、最纯粹的。

Java语言中,如果多线程共享的数据是一个基本数据类型,那么只要在定义时使用final关键字修饰它就可以保证它是不可变的。如果共享数据是一个对象,由于Java语言目前暂时还没有提供值类型的支持,那就需要对象自行保证其行为不会对其状态产生任何影响才行。如果读者没想明白这句话所指的意思,不妨类比java.lang.String类的对象实例,它是一个典型的不可变对象,用户调用它的 substring()、replace()和concat()这些方法都不会影响它原来的值,只会返回一个新构造的字符串对象。

保证对象行为不影响自己状态的途径有很多种,最简单的一种就是把对象里面带有状态的变量都声明为final,这样在构造函数结束之后,它就是不可变的。

在Java中,final关键字用于声明常量、不可变变量或方法,一旦赋值,其值就不能再被改变。当我们讨论final与值传递的关系时,主要是关注于final如何影响方法参数的传递行为。

final

final变量只能被赋值一次,赋值后值不再改变。(final要求地址值不能改变)

当final修饰一个基本数据类型时,表示该基本数据类型的值一旦在初始化后便不能发生变化;

如果final修饰一个引用类型时,则在对其初始化之后便不能再让其指向其他对象了,但该引用所指向的对象的内容是可以发生变化的。

本质上是一回事,因为引用的值是一个地址,final要求地址值不发生变化。

final成员变量:两种初始化方式,一种是在变量声明的时候初始化;第二种是在声明变量的时候不赋初值,但是要在这个变量所在的类的所有的构造函数中对这个变量赋初值。

final与基本类型的值传递

基本数据类型一旦赋值之后,就不允许修改

当我们将一个基本类型的final变量作为参数传递给方法时,由于Java的参数传递机制是值传递,传入方法的只是一个副本。尽管如此,final变量的值在这个副本中仍然是不变的,这意味着我们无法在方法体内改变这个副本的值。

public class FinalExample {
    public static void main(String[] args) {
        final int num = 10;
        changeFinalNum(num);
        System.out.println(num); // 输出 10
    }

    public static void changeFinalNum(final int num) {
        num = 20; // 编译器错误,因为num是final的,不允许重新赋值
    }
}

上述代码中,尝试在changeFinalNum方法中重新赋值给num会导致编译错误,因为num是final的。

final与对象引用的值传递

final只保证这个引用类型变量所引用的地址不会发生改变

当我们将一个final对象引用作为参数传递时,情况略有不同。虽然传递的仍然是引用的值(副本),但由于final的限制,这个引用不能被重新指向另一个对象。然而,通过这个引用修改对象的状态仍然是允许的。

public class FinalReferenceExample {
    public static void main(String[] args) {
        final MyClass obj = new MyClass(10);
        changeFinalObj(obj);
        System.out.println(obj.getValue()); // 输出 20
    }

    public static void changeFinalObj(final MyClass obj) {
        obj.setValue(20); // 允许,因为改变的是对象状态,而不是引用
        obj = new MyClass(30); // 编译器错误,因为obj是final的,不允许重新赋值
    }
}

class MyClass {
    private int value;

    public MyClass(int value) {
        this.value = value;
    }

    public int getValue() {
        return value;
    }

    public void setValue(int value) {
        this.value = value;
    }
}

在changeFinalObj方法中,我们可以通过obj引用改变MyClass实例的状态,但不能让obj引用指向一个新的MyClass实例,因为obj是final的。

总结来说,final在Java中用于确保变量或引用的值在初始化后不能被改变。在方法调用中,final的基本类型参数的值不能在方法内被改变,而final的对象引用参数则不能被重新赋值指向另一个对象,但可以通过这个引用修改对象的内部状态。

并发编程中的final

对于 final 变量,编译器和处理器都要遵守两个重排序规则:

  • 规则一:构造函数内对final域的写入与构造对象引用的赋值之间不重排序
  • 规则二:初次读取对象引用与读取final域之间不重排序

这些规则是Java内存模型(JMM,Java Memory Model)的一部分,它们确保了final字段的可见性和不可变性。

在Java中,final字段被设计为具有特殊内存语义以支持线程安全性。

规则一:构造函数内对final域的写入与构造对象引用的赋值之间不重排序

在构造函数内对一个final域的写入,与随后把这个被构造对象的引用赋值给一个引用变量,这两个操作之间不能重排序。

编译器会在final域的写之后,插入一个StoreStore屏障,这个屏障可以禁止处理器把final域的写重排序到构造函数之外。

解释:保证先写入对象的final变量,后调用该对象引用。

public class FinalDemo {
    private int a;  // 普通域
    private final int b; // final域
    private static FinalDemo finalDemo;

    public FinalDemo() {
        a = 1; // ①写普通域
        b = 2; // ②写final域
    }

    public static void writer() {
        // 两个操作:
        // 1)构造一个FinalExample类型的对象,①写普通域a=1,②写final域b=2
        // 2)③把这个对象的引用赋值给引用变量finalDemo
        finalDemo = new FinalDemo();
    }

    public static void reader() {
        FinalDemo demo = finalDemo; // ④读对象引用
        int a = demo.a;    // ⑤读普通域
        int b = demo.b;    // ⑥读final域
    }
}

假设一个线程A执行writer()方法,随后另一个线程B执行reader()方法。通过这两个线程的交互来说明写final域的规则。下图是一种可能的执行时序:

写普通域的操作可以被编译器重排序到了构造函数,①写普通域和③把这个对象的引用赋值给引用变量finalDemo重排序,导致读线程B错误的读取了普通变量a的值。

写final域的操作不能重排序到了构造函数外,②写final域和③把这个对象的引用赋值给引用变量finalDemo不能重排序,读线程B正确的读取了final变量b的值。

规则二:初次读取对象引用与读取final域之间不重排序

初次读一个包含final域的对象的引用,与随后初次读这个final域,这两个操作之间不能重排序。

编译器会在读final域操作的前面插入一个LoadLoad屏障,这个屏障可以禁止读对象引用和读该对象final域重排序。

解释:先读对象的引用,后读该对象的final变量。

还是上面那段代码,假设一个线程A执行writer()方法,随后另一个线程B执行reader()方法。下图是一种可能的执行时序:

读对象的普通域的操作可以被重排序到读对象引用之前,⑤读普通域与④读对象引用重排序,读普通域a时,a没有被写线程A写入,导致错误的读取。

读final域的操作不可以被重排序到读对象引用之前,④读对象引用和⑥读final域不能重排序,读取该final域b时已经被A线程初始化过了,不会有问题。

final域为引用类型

对于引用类型,写final域的重排序规则对编译器和处理器增加了如下约束:在构造函数内对一个final引用的对象的成员域的写入,与随后在构造函数外把这个被构造对象的引用赋值给一个引用变量,这两个操作之间不能重排序。

解释:

  1. 注意是增加了一条约束,所以以上两条约束都还生效。
  2. 保证先写入对象的final变量的成员变量,后调用该对象引用。
public class FinalReferenceDemo {
    final int[] arrays;
    private FinalReferenceDemo finalReferenceDemo;
 
    public FinalReferenceDemo() {
        arrays = new int[1];  //1
        arrays[0] = 1;        //2
    }
 
    public void writerOne() {
        finalReferenceDemo = new FinalReferenceDemo(); //3
    }
 
    public void writerTwo() {
        arrays[0] = 2;  //4
    }
 
    public void reader() {
        if (finalReferenceDemo != null) {  //5
            int temp = finalReferenceDemo.arrays[0];  //6
        }
    }
}

假设首先线程A执行writerOne()方法,执行后线程B执行writerTwo()方法,执行后线程C执行reader()方法。下面是一种可能的线程执行时序:

1是对final域的写入,2是对这个final域引用的对象的成员域的写入,3是把被构造的对象的引用赋值给某个引用变量。

由写final域的重排序规则“写final域的操作不能重排序到了构造函数外”可知,1和3是不能重排序的。

引用类型final域的重排序规则“final引用的对象的成员域的写入不能重排序到了构造函数外”,保证了2和3不能重排序。所以线程C至少能看到数组下标0的值为1。

写线程B对数组元素的写入,读线程C不一定能看到。因为写线程B和读线程C之间存在数据竞争,此时的执行结果不可预知。

final并不等同于immutable
final List<String> strList = new ArrayList<>();

strList.add("Hello");
strList.add("world");  

List<String> unmodifiableStrList = List.of("hello", "world");
unmodifiableStrList.add("again");

final只能约束strList这个引用不可以被赋值,但是strList对象行为不被final影响,添加元素等操作是完全正常的。如果我们真的希望对象本身是不可变的,那么需要相应的类支持不可变的行为。在上面这个例子中,List.of方法创建的本身就是不可变List,最后那句add是会在运行时抛出异常的。

Immutable在很多场景是非常棒的选择,某种意义上说,Java语言目前并没有原生的不可变支持,如果要实现immutable的类,我们需要做到:

  • 将class自身声明为final,这样别人就不能扩展来绕过限制了。
  • 将所有成员变量定义为private和final,并且不要实现setter方法。
  • 通常构造对象时,成员变量使用深度拷贝来初始化,而不是直接赋值,这是一种防御措施,因为你无法确定输入对象不被其他人修改。
  • 如果确实需要实现getter方法,或者其他可能会返回内部状态的方法,使用copy-on-write原则,创建私有的copy。

2.绝对线程安全

绝对的线程安全能够完全满足Brian Goetz给出的线程安全的定义,这个定义其实是很严格的,一个类要达到“不管运行时环境如何,调用者都不需要任何额外的同步措施”可能需要付出非常高昂的,甚至不切实际的代价。在Java API中标注自己是线程安全的类,大多数都不是绝对的线程安全。我们可以通过Java API中一个不是“绝对线程安全”的“线程安全类型”来看看这个语境里的“绝对”究竟是什么意思。

如果说java.util.Vector是一个线程安全的容器,相信所有的Java程序员对此都不会有异议,因为它的add()、get()和size()等方法都是被synchronized修饰的,尽管这样效率不高,但保证了具备原子性、可见性和有序性。不过,即使它所有的方法都被修饰成synchronized,也不意味着调用它的时候就永远都不再需要同步手段了,请看看代码清单13-2中的测试代码。

代码清单13-2 对Vector线程安全的测试

private static Vector<Integer> vector = new Vector<Integer>(); 
public static void main(String[] args) { 
	while (true) { 
		for (int i = 0; i < 10; i++) { 
			vector.add(i); 
		}
		Thread removeThread = new Thread(new Runnable() { 
			@Override 
			public void run() { 
				for (int i = 0; i < vector.size(); i++) { 
					vector.remove(i); 
				} 
			} 
		}); 
		Thread printThread = new Thread(new Runnable() { 
			@Override 
			public void run() { 
				for (int i = 0; i < vector.size(); i++) { 
					System.out.println((vector.get(i))); 
				} 
			} 
		}); 
		removeThread.start(); 
		printThread.start(); 
		//不要同时产生过多的线程,否则会导致操作系统假死 
		while (Thread.activeCount() > 20); 
	} 
} 

运行结果如下:

Exception in thread “Thread-132” java.lang.ArrayIndexOutOfBoundsException:
Array index out of range: 17
at java.util.Vector.remove(Vector.java:777)
at org.fenixsoft.mulithread.VectorTest$1.run(VectorTest.java:21)
at java.lang.Thread.run(Thread.java:662)

很明显,尽管这里使用到的Vector的get()、remove()和size()方法都是同步的,但是在多线程的环境中,如果不在方法调用端做额外的同步措施,使用这段代码仍然是不安全的。因为如果另一个线程恰好在错误的时间里删除了一个元素,导致序号i已经不再可用,再用i访问数组就会抛出一个ArrayIndexOutOfBoundsException异常。如果要保证这段代码能正确执行下去,我们不得不把removeThread和printThread的定义改成代码清单13-3所示的这样。

代码清单13-3 必须加入同步保证Vector访问的线程安全性

Thread removeThread = new Thread(new Runnable() { 
	@Override 
	public void run() { 
		synchronized (vector) { 
			for (int i = 0; i < vector.size(); i++) { 
				vector.remove(i); 
			} 
		} 
	} 
}); 
Thread printThread = new Thread(new Runnable() { 
	@Override 
	public void run() { 
		synchronized (vector) { 
			for (int i = 0; i < vector.size(); i++) { 
				System.out.println((vector.get(i))); 
			} 
		} 
	} 
});

假如Vector一定要做到绝对的线程安全,那就必须在它内部维护一组一致性的快照访问才行,每次对其中元素进行改动都要产生新的快照,这样要付出的时间和空间成本都是非常大的。

3.相对线程安全

相对线程安全就是我们通常意义上所讲的线程安全,它需要保证对这个对象单次的操作是线程安全的,我们在调用的时候不需要进行额外的保障措施,但是对于一些特定顺序的连续调用,就可能需要在调用端使用额外的同步手段来保证调用的正确性。代码清单13-2和代码清单13-3就是相对线程安全的案例。

在Java语言中,大部分声称线程安全的类都属于这种类型,例如Vector、HashTable、Collections的 synchronizedCollection()方法包装的集合等。

4.线程兼容

线程兼容是指对象本身并不是线程安全的,但是可以通过在调用端正确地使用同步手段来保证对象在并发环境中可以安全地使用。我们平常说一个类不是线程安全的,通常就是指这种情况。Java类库API中大部分的类都是线程兼容的,如与前面的Vector和HashTable相对应的集合类ArrayList和HashMap等。

对象或代码本身可能并不具备内置的线程安全机制,但在外部调用时,通过适当的同步手段(比如使用synchronized关键字或其他锁机制)来控制对它的访问,从而保证了在多线程环境下的正确性和一致性。

5.线程对立

线程对立是指不管调用端是否采取了同步措施,都无法在多线程环境中并发使用代码。由于Java 语言天生就支持多线程的特性,线程对立这种排斥多线程的代码是很少出现的,而且通常都是有害的,应当尽量避免。

一个线程对立的例子是Thread类的suspend()和resume()方法。如果有两个线程同时持有一个线程对象,一个尝试去中断线程,一个尝试去恢复线程,在并发进行的情况下,无论调用时是否进行了同步,目标线程都存在死锁风险——假如suspend()中断的线程就是即将要执行resume()的那个线程,那就肯定要产生死锁了。也正是这个原因,suspend()和resume()方法都已经被声明废弃了。常见的线程对立的操作还有System.setIn()、Sytem.setOut()和System.runFinalizersOnExit()等。

2.2 线程安全的实现方法

了解过什么是线程安全之后,紧接着的一个问题就是我们应该如何实现线程安全。这听起来似乎是一件由代码如何编写来决定的事情,不应该出现在讲解Java虚拟机的书里。确实,如何实现线程安全与代码编写有很大的关系,但虚拟机提供的同步和锁机制也起到了至关重要的作用。

1.互斥同步

互斥同步(Mutual Exclusion & Synchronization)是一种最常见也是最主要的并发正确性保障手段。

  • 同步是指在多个线程并发访问共享数据时,保证共享数据在同一个时刻只被一条(或者是一些, 当使用信号量的时候)线程使用
  • 互斥是实现同步的一种手段,临界区(Critical Section)、互斥量 (Mutex)和信号量(Semaphore) 都是常见的互斥实现方式

因此在“互斥同步”这四个字里面,互斥是因,同步是果;互斥是方法,同步是目的。

在Java里面,最基本的互斥同步手段就是synchronized关键字,这是一种块结构(Block Structured)的同步语法。synchronized关键字经过Javac编译之后,会在同步块的前后分别形成 monitorenter和monitorexit这两个字节码指令。这两个字节码指令都需要一个reference类型的参数来指明要加锁和解锁的对象。如果Java源码中的synchronized明确指定了对象参数,那就以这个对象的引用作为reference;如果没有明确指定,那将根据synchronized修饰的方法类型(如实例方法或类方法),来决定是取代码所在的对象实例还是取类型对应的Class对象来作为线程要持有的锁。

根据《Java虚拟机规范》的要求,在执行monitorenter指令时,首先要去尝试获取对象的锁。如果这个对象没被锁定,或者当前线程已经持有了那个对象的锁,就把锁的计数器的值增加一,而在执行 monitorexit指令时会将锁计数器的值减一。一旦计数器的值为零,锁随即就被释放了。如果获取对象锁失败,那当前线程就应当被阻塞等待,直到请求锁定的对象被持有它的线程释放为止。

从功能上看,根据以上《Java虚拟机规范》对monitorenter和monitorexit的行为描述,我们可以得出两个关于synchronized的直接推论,这是使用它时需特别注意的:

  • 被synchronized修饰的同步块对同一条线程来说是可重入的。这意味着同一线程反复进入同步块也不会出现自己把自己锁死的情况。
  • 被synchronized修饰的同步块在持有锁的线程执行完毕并释放锁之前,会无条件地阻塞后面其他线程的进入。这意味着无法像处理某些数据库中的锁那样,强制已获取锁的线程释放锁;也无法强制正在等待锁的线程中断等待或超时退出。

从执行成本的角度看,持有锁是一个重量级(Heavy-Weight)的操作。在主流Java虚拟机实现中,Java的线程是映射到操作系统的原生内核线程之上的,如果要阻塞或唤醒一条线程,则需要操作系统来帮忙完成,这就不可避免地陷入用户态到核心态的转换中,进行这种状态转换需要耗费很多的处理器时间。尤其是对于代码特别简单的同步块(譬如被synchronized修饰的getter()或setter()方法),状态转换消耗的时间甚至会比用户代码本身执行的时间还要长。 因此才说,synchronized是Java语言中一个重量级的操作,有经验的程序员都只会在确实必要的情况下才使用这种操作。而虚拟机本身也会进行一些优化,譬如在通知操作系统阻塞线程之前加入一段自旋等待过程,以避免频繁地切入核心态之中。稍后我们会专门介绍Java虚拟机锁优化的措施。

从上面的介绍中我们可以看到synchronized的局限性,除了synchronized关键字以外,自JDK 5起 (实现了JSR 166),Java类库中新提供了java.util.concurrent包(下文称J.U.C包),其中的 java.util.concurrent.locks.Lock接口便成了Java的另一种全新的互斥同步手段。基于Lock接口,用户能够以非块结构(Non-Block Structured)来实现互斥同步,从而摆脱了语言特性的束缚,改为在类库层面去实现同步,这也为日后扩展出不同调度算法、不同特征、不同性能、不同语义的各种锁提供了广阔的空间。

重入锁(ReentrantLock)是Lock接口最常见的一种实现,顾名思义,它与synchronized一样是可重入的。在基本用法上,ReentrantLock也与synchronized很相似,只是代码写法上稍有区别而已。不过,ReentrantLock与synchronized相比增加了一些高级功能,主要有以下三项:等待可中断、可实现公平锁及锁可以绑定多个条件。

  • 等待可中断:是指当持有锁的线程长期不释放锁的时候,正在等待的线程可以选择放弃等待,改为处理其他事情。可中断特性对处理执行时间非常长的同步块很有帮助。
  • 公平锁:是指多个线程在等待同一个锁时,必须按照申请锁的时间顺序来依次获得锁;而非公平锁则不保证这一点,在锁被释放时,任何一个等待锁的线程都有机会获得锁。synchronized中的锁是非公平的,ReentrantLock在默认情况下也是非公平的,但可以通过带布尔值的构造函数要求使用公平锁。不过一旦使用了公平锁,将会导致ReentrantLock的性能急剧下降,会明显影响吞吐量。
  • 锁绑定多个条件:是指一个ReentrantLock对象可以同时绑定多个Condition对象。在synchronized 中,锁对象的wait()跟它的notify()或者notifyAll()方法配合可以实现一个隐含的条件,如果要和多于一个的条件关联的时候,就不得不额外添加一个锁;而ReentrantLock则无须这样做,多次调用 newCondition()方法即可。

如果需要使用上述功能,使用ReentrantLock是一个很好的选择,那如果是基于性能考虑呢?synchronized对性能的影响,尤其在JDK 5之前是很显著的,为此在JDK 6中还专门进行过针对性的优化。以synchronized和ReentrantLock的性能对比为例,Brian Goetz对这两种锁在JDK 5、单核处理器及 双Xeon处理器环境下做了一组吞吐量对比的实验,实验结果如图13-1和图13-2所示。

从图13-1和图13-2中可以看出,多线程环境下synchronized的吞吐量下降得非常严重,而 ReentrantLock则能基本保持在同一个相对稳定的水平上。但与其说ReentrantLock性能好,倒不如说当时的synchronized有非常大的优化余地,后续的技术发展也证明了这一点。当JDK 6中加入了大量针对 synchronized锁的优化措施之后,相同的测试中就发现 synchronized与ReentrantLock的性能基本上能够持平。相信现在阅读本书的读者所开发的程序应该都是使用JDK 6或以上版本来部署的,所以性能已经不再是选择synchronized或者ReentrantLock的决定因素。

根据上面的讨论,ReentrantLock在功能上是synchronized的超集,在性能上又至少不会弱于 synchronized,那synchronized修饰符是否应该被直接抛弃,不再使用了呢?当然不是,基于以下理由,笔者仍然推荐在synchronized与ReentrantLock都可满足需要时优先使用synchronized:

  • synchronized是在Java语法层面的同步,足够清晰,也足够简单。每个Java程序员都熟悉 synchronized,但J.U.C中的Lock接口则并非如此。因此在只需要基础的同步功能时,更推荐 synchronized。
  • Lock应该确保在finally块中释放锁,否则一旦受同步保护的代码块中抛出异常,则有可能永远不会释放持有的锁。这一点必须由程序员自己来保证,而使用synchronized的话则可以由Java虚拟机来确保即使出现异常,锁也能被自动释放。
  • 尽管在JDK 5时代ReentrantLock曾经在性能上领先过synchronized,但这已经是十多年之前的胜利了。从长远来看,Java虚拟机更容易针对synchronized来进行优化,因为Java虚拟机可以在线程和对象的元数据中记录synchronized中锁的相关信息,而使用J.U.C中的Lock的话,Java虚拟机是很难得知具体哪些锁对象是由特定线程锁持有的。

2.非阻塞同步

互斥同步面临的主要问题是进行线程阻塞和唤醒所带来的性能开销,因此这种同步也被称为阻塞同步(Blocking Synchronization)。从解决问题的方式上看,互斥同步属于一种悲观的并发策略,其总是认为只要不去做正确的同步措施(例如加锁),那就肯定会出现问题,无论共享的数据是否真的会出现竞争,它都会进行加锁(这里讨论的是概念模型,实际上虚拟机会优化掉很大一部分不必要的加锁),这将会导致用户态到核心态转换、维护锁计数器和检查是否有被阻塞的线程需要被唤醒等开销。

随着硬件指令集的发展,我们已经有了另外一个选择:基于冲突检测的乐观并发策略,通俗地说就是不管风险,先进行操作,如果没有其他线程争用共享数据,那操作就直接成功了;如果共享的数据的确被争用,产生了冲突,那再进行其他的补偿措施,最常用的补偿措施是不断地重试,直到出现没有竞争的共享数据为止。这种乐观并发策略的实现不再需要把线程阻塞挂起,因此这种同步操作被称为非阻塞同步(Non-Blocking Synchronization),使用这种措施的代码也常被称为无锁编程。

为什么说使用乐观并发策略需要“硬件指令集的发展”?因为我们必须要求操作和冲突检测这两个步骤具备原子性。靠什么来保证原子性?如果这里再使用互斥同步来保证就完全失去意义了,所以我们只能靠硬件来实现这件事情,硬件保证某些从语义上看起来需要多次操作的行为可以只通过一条处理器指令就能完成,这类指令常用的有:

  • 测试并设置(Test-and-Set);
  • 获取并增加(Fetch-and-Increment);
  • 交换(Swap);
  • 比较并交换(Compare-and-Swap,下文称CAS);
  • 加载链接/条件储存(Load-Linked/Store-Conditional,下文称LL/SC)。

其中,前面的三条是20世纪就已经存在于大多数指令集之中的处理器指令,后面的两条是现代处理器新增的,而且这两条指令的目的和功能也是类似的。在IA64、x86指令集中有用cmpxchg指令完成的CAS功能,在SPARC-TSO中也有用casa指令实现的,而在ARM和PowerPC架构下,则需要使用一对 ldrex/strex指令来完成LL/SC的功能。因为Java里最终暴露出来的是CAS操作,所以我们以CAS指令为例进行讲解。

CAS指令需要有三个操作数,分别是内存位置(在Java中可以简单地理解为变量的内存地址,用V表示)、旧的预期值(用A表示)和准备设置的新值(用B表示)。CAS指令执行时,当且仅当V符合A时,处理器才会用B更新V的值,否则它就不执行更新。但是,不管是否更新了V的值,都会返回V的旧值,上述的处理过程是一个原子操作,执行期间不会被其他线程中断。

在JDK 5之后,Java类库中才开始使用CAS操作,该操作由sun.misc.Unsafe类里面的 compareAndSwapInt()和compareAndSwapLong()等几个方法包装提供。HotSpot虚拟机在内部对这些方法做了特殊处理,即时编译出来的结果就是一条平台相关的处理器CAS指令,没有方法调用的过程, 或者可以认为是无条件内联进去了。不过由于Unsafe类在设计上就不是提供给用户程序调用的类 (Unsafe::getUnsafe()的代码中限制了只有启动类加载器(Bootstrap ClassLoader)加载的Class才能访问它),因此在JDK 9之前只有Java类库可以使用CAS,譬如J.U.C包里面的整数原子类,其中的 compareAndSet()和getAndIncrement()等方法都使用了Unsafe类的CAS操作来实现。而如果用户程序也有使用CAS操作的需求,那要么就采用反射手段突破Unsafe的访问限制,要么就只能通过Java类库API来间接使用它。直到JDK 9之后,Java类库才在VarHandle类里开放了面向用户程序使用的CAS操作。

下面笔者将用一段在前面章节中没有解决的问题代码来介绍如何通过CAS操作避免阻塞同步。测试的代码如代码清单12-1所示,为了节省版面笔者就不重复贴到这里了。这段代码里我们曾经通过20 个线程自增10000次的操作来证明volatile变量不具备原子性,那么如何才能让它具备原子性呢?之前我们的解决方案是把race++操作或increase()方法用同步块包裹起来,这毫无疑问是一个解决方案,但是如果改成代码清单13-4所示的写法,效率将会提高许多。

代码清单13-4 Atomic的原子自增运算

import java.util.concurrent.atomic.AtomicInteger;

/**
 * Atomic变量自增运算测试
 */
public class AtomicTest {
    public static AtomicInteger race = new AtomicInteger(0);

    public static void increase() {
        race.incrementAndGet();
    }

    private static final int THREADS_COUNT = 20;

    public static void main(String[] args) throws Exception {
        Thread[] threads = new Thread[THREADS_COUNT];
        for (int i = 0; i < THREADS_COUNT; i++) {
            threads[i] = new Thread(new Runnable() {
                @Override
                public void run() {
                    for (int i = 0; i < 10000; i++) {
                        increase();
                    }
                }
            });
            threads[i].start();
        }

        while (Thread.activeCount() > 1) Thread.yield();
        System.out.println(race);
    }
}

运行结果如下: 200000 使用AtomicInteger代替int后,程序输出了正确的结果,这一切都要归功于incrementAndGet()方法的原子性。它的实现其实非常简单,如代码清单13-5所示。

代码清单13-5 incrementAndGet()方法

/**
* Atomically increment by one the current value. * @return the updated value
*/
public final int incrementAndGet() { 
    for (;;) {
        int current = get();
        int next = current + 1;
        if (compareAndSet(current, next))
            return next;
    } }

incrementAndGet()方法在一个无限循环中,不断尝试将一个比当前值大一的新值赋值给自己。如果失败了,那说明在执行CAS操作的时候,旧值已经发生改变,于是再次循环进行下一次操作,直到设置成功为止。

尽管CAS看起来很美好,既简单又高效,但显然这种操作无法涵盖互斥同步的所有使用场景,并且CAS从语义上来说并不是真正完美的,它存在一个逻辑漏洞:如果一个变量V初次读取的时候是A 值,并且在准备赋值的时候检查到它仍然为A值,那就能说明它的值没有被其他线程改变过了吗?这是不能的,因为如果在这段期间它的值曾经被改成B,后来又被改回为A,那CAS操作就会误认为它从来没有被改变过。这个漏洞称为CAS操作的“ABA问题”。J.U.C包为了解决这个问题,提供了一个带有标记的原子引用类AtomicStampedReference,它可以通过控制变量值的版本来保证CAS的正确性。不过目前来说这个类处于相当鸡肋的位置,大部分情况下ABA问题不会影响程序并发的正确性,如果需要解决ABA问题,改用传统的互斥同步可能会比原子类更为高效。

3.无同步方案

要保证线程安全,也并非一定要进行阻塞或非阻塞同步,同步与线程安全两者没有必然的联系。同步只是保障存在共享数据争用时正确性的手段,如果能让一个方法本来就不涉及共享数据,那它自然就不需要任何同步措施去保证其正确性,因此会有一些代码天生就是线程安全的。

可重入代码(Reentrant Code)/无状态函数

可重入代码(Reentrant Code):这种代码又称纯代码(Pure Code),是指可以在代码执行的任何时刻中断它,转而去执行另外一段代码(包括递归调用它本身),而在控制权返回后,原来的程序不会出现任何错误,也不会对结果有所影响。在特指多线程的上下文语境里(不涉及信号量等因素),我们可以认为可重入代码是线程安全代码的一个真子集,这意味着相对线程安全来说,可重入性是更为基础的特性,它可以保证代码线程安全,即所有可重入的代码都是线程安全的,但并非所有的线程安全的代码都是可重入的。

可重入代码有一些共同的特征,例如,不依赖全局变量、存储在堆上的数据和公用的系统资源,用到的状态量都由参数中传入,不调用非可重入的方法等。我们可以通过一个比较简单的原则来判断代码是否具备可重入性:如果一个方法的返回结果是可以预测的,只要输入了相同的数据,就都能返回相同的结果,那它就满足可重入性的要求,当然也就是线程安全的。

无状态函数(Stateless Function)是一种编程模式,其中函数的行为仅取决于其输入参数,而不依赖于任何外部状态或先前的调用历史。这意味着相同输入总是会产生相同的输出,而且函数的执行不会产生任何副作用。这种函数非常适合并行处理和分布式计算环境,因为它们不需要考虑线程安全、数据同步等问题,可以自由地在多个处理器或机器上并行执行。

无状态函数的几个关键特性包括:

  1. 纯函数:无状态函数往往也是纯函数(Pure Function),即函数的输出只依赖于输入,不依赖于函数外部的任何状态。这使得函数易于理解和测试,因为每次调用的结果都是可预测的。
  2. 并行友好:由于无状态函数不会修改任何共享状态,它们可以在多个线程或处理器上并行执行,而不用担心数据竞争或死锁问题。
  3. 可重入性:无状态函数可以被多次调用,而不会影响到函数内部的状态,这使得它们在多线程环境中更加健壮。
  4. 易于调试:由于函数的行为不随时间或外部条件变化,调试变得相对简单,因为结果的可预测性使得错误更容易定位。
  5. 缓存友好:如果一个函数是无状态的,它的输出可以根据输入参数进行缓存,这样在下次遇到相同输入时可以直接返回缓存的结果,从而节省计算资源。

在函数式编程语言中,无状态函数的使用非常普遍,但即使在面向对象或过程式编程中,也可以通过将状态封装在类或模块内部,使对外暴露的接口表现为无状态函数。

def add(a,b){
     return a+b
}

这个函数接受两个参数 a 和 b,返回它们的和。无论何时调用这个函数,只要输入相同,输出就会相同,而且它不会影响到程序的任何其他部分。这种特性使得无状态函数成为构建复杂系统时的一种强大工具。

线程本地存储(Thread Local Storage TLS)

线程本地存储(Thread Local Storage):如果一段代码中所需要的数据必须与其他代码共享,那就看看这些共享数据的代码是否能保证在同一个线程中执行。如果能保证,我们就可以把共享数据的可见范围限制在同一个线程之内,这样,无须同步也能保证线程之间不出现数据争用的问题。

线程本地存储(Thread Local Storage,TLS)是一种编程模式,用于在线程之间隔离数据,使得每个线程都有自己的数据副本。这种模式特别适用于那些希望避免线程间数据竞争和同步开销的情况。当一个程序使用TLS时,它实际上是在每个线程的上下文中创建了一个独立的存储空间,这样即使多个线程访问同一“全局”变量,实际上它们访问的是各自独立的副本。

在多线程环境下,TLS提供了一种有效的方式来维护线程之间的隔离性,从而简化了线程安全的设计和实现。

下面是一些TLS适用的场景:

  1. Web 服务器中的 Thread-per-Request 模式: 在传统的 Web 服务器设计中,每当有新的 HTTP 请求到达时,服务器会分配一个新的线程来处理这个请求。在这种情况下,TLS 可以用来存储特定于请求的信息,比如用户会话、事务状态或数据库连接,这样每个请求都在其专用的线程内处理,不会干扰其他请求的处理流程。
  2. 日志记录: TLS 可以用于存储线程特定的日志上下文,如线程ID、用户ID或请求ID,这有助于在日志文件中区分不同线程的活动,便于后续的分析和调试。
  3. 事务管理: 在数据库操作中,每个线程可能需要维护自己的事务状态。TLS 提供了一种方法来确保每个线程都有其独立的事务管理器实例,避免了线程间的相互影响。
  4. 线程池中的任务数据: 在使用线程池时,每个工作线程可以使用 TLS 来存储一些初始化数据,如缓存或配置信息,这样可以减少每次任务开始前的初始化成本。

在 Java 中,java.lang.ThreadLocal 类提供了 TLS 的实现。开发人员可以创建一个 ThreadLocal 对象,并使用 get() 和 set() 方法来获取和设置线程本地变量的值。由于每个线程都有自己的 ThreadLocal 副本,因此无需担心数据竞争或同步问题。

使用 TLS 的主要优势在于它可以极大地简化多线程编程,减少锁的使用,从而提高应用程序的并发性能。然而,过度使用 TLS 或者不当的使用也可能导致内存泄漏,因为每个线程的 TLS 数据在默认情况下并不会随着线程的结束而自动释放,除非手动清理。

如果一个变量要被多线程访问,可以使用volatile关键字将它声明为“易变的”

volatile 关键字在 Java 和其他一些编程语言中用于标记那些可能被多个线程异步修改的变量。当一个变量被声明为 volatile 时,它告诉编译器和运行时环境该变量可能在任何时候被另一个线程更改,因此每次读取这个变量都必须从主内存中读取最新的值,而不是从线程的工作内存中读取可能过期的副本。

volatile 关键字的主要作用和好处包括:

  1. 保证可见性:当一个线程修改了一个 volatile 变量后,新值会被立即写回到主内存中。然后,任何读取该变量的线程都将从主内存中读取最新的值,这保证了所有线程看到的该变量的值是最新的。
  2. 禁止指令重排:volatile 还可以防止编译器和处理器对代码的指令重排序,这是为了确保读写操作的顺序符合程序员的预期。在多线程环境中,指令重排序可能会导致难以预料的行为。

然而,volatile 并不能提供完整的线程安全性。具体来说,它不能保证原子性。例如,如果你有一个 volatile int counter 并试图对其进行自增操作(counter++),这实际上是包含多个步骤的操作(读取当前值,增加1,再写回新值),而在多线程环境下,这些步骤可能会被中断,导致竞态条件。因此,对于复合操作(如自增、比较并交换等),volatile 单独使用是不够的,可能还需要其他同步机制,如锁或原子变量(如 AtomicInteger)来保证操作的原子性和线程安全性。

如果一个变量只要被某个线程独享,Java中就没有类似C++中__declspec(thread)这样的关键字去修饰,不过我们还是可以通过java.lang.ThreadLocal类来实现线程本地存储的功能。每一个线程的Thread对象中都有一个ThreadLocalMap对象,这个对象存储了一组以ThreadLocal.threadLocalHashCode为键,以本地线程变量为值的K-V值对,ThreadLocal对象就是当前线程的ThreadLocalMap的访问入口,每一个 ThreadLocal对象都包含了一个独一无二的threadLocalHashCode值,使用这个值就可以在线程K-V值对中找回对应的本地线程变量。