Java并发

297 阅读29分钟

1.使用线程

有三种使用线程的方法:

  • 实现Runnable接口;
  • 实现Callable接口;
  • 继承Thread类

实现Runnable和Callabe接口的类只能当做一个可以在线程中运行的任务,不是真正意义上的线程,因此最后还需要通过Thread来调用。可以理解为任务是通过线程驱动从而执行的。

1.1 实现Runnable接口

需要实现接口中的run()方法

public class MyRunnable implements Runnable {
    @Override
    public void run() {
        // ...
    }
}

使用Runnable实例在创建一个Thread实例,然后调用Thread实例的start()方法来启动线程

public static void main(String[] args) {
    MyRunnable instance = new MyRunnable();
    Thread thread = new Thread(instance);
    thread.start();
}

1.2 实现Callable接口

与Runnable相比,Callable可以有返回值,通过Future进行封装

public class MyCallable implements Callable<Integer> {
    public Integer call() {
        return 123;
    }
}
public static void main(String[] args) throws ExecutionException, InterruptedException {
    MyCallable mc = new MyCallable();
    FutureTask<Integer> ft = new FutureTask<>(mc);
    Thread thread = new Thread(ft);
    thread.start();
    System.out.println(ft.get());
}

1.3 继承Thread类

同样也是需要run()方法,因为Thread类也实现了Runable接口

当调用start()方法启动一个线程时,虚拟机会将该线程放入就绪队列中等待被调度,当一个线程被调度时会执行该线程的run方法()

public class MyThread extends Thread {
    public void run() {
        // ...
    }
}
public static void main(String[] args) {
    MyThread mt = new MyThread();
    mt.start();
}

1.4 实现接口 VS 继承

实现接口会更好一些, 因为:

  • Java不支持多重继承,因此继承了Thread类就无法继承其它类,但是可以实现多个接口
  • 类可能只要求可执行就行,继承整个Thead类开销过大

2.基础线程机制

2.1 Executor

Executor管理多个异步任务的执行,而无需程序员显示地管理线程的生命周期。这里的异步是指多个任务的执行互不干扰,不需要进行同步操作

主要有三种Executor:

  • CachedThreadPool: 一个任务创建一个线程;
  • FixedThreadPool: 所有任务只能使用固定大小的线程;
  • SingleThreadPool: 相当于大小为1的FixedThreadPool
public static void main(String[] args) {
    ExecutorService executorService = Executors.newCachedThreadPool();
    for (int i = 0; i < 5; i++) {
        executorService.execute(new MyRunnable());
    }
    executorService.shutdown();
}

2.2 Daemon

守护线程时程序运行时在后台提供服务的线程,不属于程序中不可获取的部分

当所有非守护线程结束时,程序也就终止,同时会杀死所有守护线程

main()属于非守护线程

在线程启动之前使用setDaemon()方法可以将一个线程设置为守护线程

public static void main(String[] args) {
    Thread thread = new Thread(new MyRunnable());
    thread.setDaemon(true);
}

2.3 sleep()

Thread.sleep(millisec) 方法会休眠当前正在执行的线程,millisec单位为毫秒

sleep()可能会抛出InterruptedException,因为异常不会跨线程传播回main()中,因此必须在本地进行处理。线程中抛出的其它异常也同样需要在本地进行处理

public void run() {
    try {
        Thread.sleep(3000);
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
}

2.4 yield()

对静态方法Thread.yield()的调用声明了当前线程已经完成了生命周期中最重要的部分,可以切换给其它线程来执行。该方法只是对线程调度器的一个建议,而且也只是建议具有相同优先级的其它线程可以运行

public void run() {
    Thread.yield();
}

3.中断

一个线程执行完毕之后会自动结束,如果在运行过程中发生异常也会提前结束

3.1 InterruptedException

通过调用一个线程的interrupt()来中断该线程,如果该线程处于阻塞、限期等待或者无限期等待状态,那么就会抛出InterruptedException,从而提前结束该线程。但是不能中断IO阻塞和synchronized锁阻塞

对于以下代码,在main()中启动一个线程之后再中断它,由于线程中调用了Thread.sleep()方法,因此会抛出一个InterruptException,从而提前结束线程,不执行之后的语句

public class InterruptExample {

    private static class MyThread1 extends Thread {
        @Override
        public void run() {
            try {
                Thread.sleep(2000);
                System.out.println("Thread run");
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    }
}
public static void main(String[] args) throws InterruptedException {
    Thread thread1 = new MyThread1();
    thread1.start();
    thread1.interrupt();
    System.out.println("Main run");
}
Main run
java.lang.InterruptedException: sleep interrupted
    at java.lang.Thread.sleep(Native Method)
    at InterruptExample.lambda$main$0(InterruptExample.java:5)
    at InterruptExample$$Lambda$1/713338599.run(Unknown Source)
    at java.lang.Thread.run(Thread.java:745)

3.2 Interrupted()

如果一个线程的run()方法执行一个无限循环,并且没有执行sleep()等会抛出InterruptedException的操作,那么调用线程的interrupt()方法就无法使线程提前结束

但是调用interrupt()方法会设置线程的中断标记,此时调用interrupted()方法会返回true。因此可以再循环体中使用interrupted()方法来判断线程是否处于中断状态,从而提前结束线程

public class InterruptExample {

    private static class MyThread2 extends Thread {
        @Override
        public void run() {
            while (!interrupted()) {
                // ..
            }
            System.out.println("Thread end");
        }
    }
}
public static void main(String[] args) throws InterruptedException {
    Thread thread2 = new MyThread2();
    thread2.start();
    thread2.interrupt();
}
Thread end

3.3 Executor的中断操作

调用Executor的shutdown()方法会等待线程都执行完毕之后再关闭,但是如果调用的使shutdownNow()方法,则相当于调用每个线程的interrupt()方法

以下使用lambda创建线程,相当于创建了一个匿名内部线程

public static void main(String[] args) {
    ExecutorService executorService = Executors.newCachedThreadPool();
    executorService.execute(() -> {
        try {
            Thread.sleep(2000);
            System.out.println("Thread run");
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    });
    executorService.shutdownNow();
    System.out.println("Main run");
}
Main run
java.lang.InterruptedException: sleep interrupted
    at java.lang.Thread.sleep(Native Method)
    at ExecutorInterruptExample.lambda$main$0(ExecutorInterruptExample.java:9)
    at ExecutorInterruptExample$$Lambda$1/1160460865.run(Unknown Source)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
    at java.lang.Thread.run(Thread.java:745)

如果只想中断Executor中的一个线程,可以通过使用submit()方法来提交一个线程,它会返回一个Future<?>对象,通过调用对象的cancel(true)方法就可以中断线程

Future<?> future = executorService.submit(() -> {
    // ..
});
future.cancel(true);

4.互斥同步

Java提供了两种锁机制来控制多个线程对共享资源的互斥访问,第一个使JVM实现的synchronized,而另一个是JDK实现的ReentrantLock

4.1 synchronzied

4.1.1 同步一个代码块

public void func() {
    synchronized (this) {
        // ...
    }
}

它只作用于同一个对象,如果调用两个对象上的同步代码块,就不会进行同步

对于以下代码,使用ExecutorService执行了两个线程,由于调用的是同一个对象的同步代码块,因此这两个线程会进行同步,当一个线程进入同步语句块时,那么另一个线程就必须等待

public class SynchronizedExample {

    public void func1() {
        synchronized (this) {
            for (int i = 0; i < 10; i++) {
                System.out.print(i + " ");
            }
        }
    }
}
public static void main(String[] args) {
    SynchronizedExample e1 = new SynchronizedExample();
    ExecutorService executorService = Executors.newCachedThreadPool();
    executorService.execute(() -> e1.func1());
    executorService.execute(() -> e1.func1());
}

0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9

对于以下代码,两个线程调用了不同对象的同步代码块,因此这两个线程就不需要同步,从删除结果可以看出,两个线程交叉执行

public static void main(String[] args) {
    SynchronizedExample e1 = new SynchronizedExample();
    SynchronizedExample e2 = new SynchronizedExample();
    ExecutorService executorService = Executors.newCachedThreadPool();
    executorService.execute(() -> e1.func1());
    executorService.execute(() -> e2.func1());
}

0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9

4.1.2 同步一个方法

public synchronized void func () {
    // ...
}

它和同步代码块一样,作用于同一对象

4.1.3 同步一个类

public void func() {
    synchronized (SynchronizedExample.class) {
        // ...
    }
}

作用于整个类,也就是说两个线程调用同一个类的不同对象上的这种同步语句,也会进行同步

public class SynchronizedExample {

    public void func2() {
        synchronized (SynchronizedExample.class) {
            for (int i = 0; i < 10; i++) {
                System.out.print(i + " ");
            }
        }
    }
}
public static void main(String[] args) {
    SynchronizedExample e1 = new SynchronizedExample();
    SynchronizedExample e2 = new SynchronizedExample();
    ExecutorService executorService = Executors.newCachedThreadPool();
    executorService.execute(() -> e1.func2());
    executorService.execute(() -> e2.func2());
}

0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9

4.1.4 同步一个静态方法

public synchronized static void fun() {
    // ...
}

作用于整个类

4.2 ReentrantLock

ReentrantLock是JUC包中的锁

public class LockExample {

    private Lock lock = new ReentrantLock();

    public void func() {
        lock.lock();
        try {
            for (int i = 0; i < 10; i++) {
                System.out.print(i + " ");
            }
        } finally {
            lock.unlock(); // 确保释放锁,从而避免发生死锁。
        }
    }
}
public static void main(String[] args) {
    LockExample lockExample = new LockExample();
    ExecutorService executorService = Executors.newCachedThreadPool();
    executorService.execute(() -> lockExample.func());
    executorService.execute(() -> lockExample.func());
}

0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9

4.3 比较

4.3.1 锁的实现

  • sync是JVM的实现,
  • 而ReentrantLock是JDK实现的

4.3.2 性能

  • 新版本 Java对sync进行了很多优化,例如自旋锁等,
  • sync与ReentrantLock大致相同

4.3.3 等待可中断

  • 当持有锁的线程长期不释放锁的时候,正在等待的线程可以选择放弃等待,改为处理其它事情

  • ReentrantLock可中断,sync不能中断

4.3.4 公平锁

  • 公平锁是指多个线程在等待同一个锁时,必须按照申请锁的时间顺序来一次获得锁

  • sync中的锁时非公平的,ReentrantLock默认情况下也是非公平的,但是也可以时公平的

4.3.5 锁绑定多个条件

  • 一个ReentrantLock可以同时绑定多个Condition对象

4.4 使用选择

除非需要使用ReentrantLock的高级功能,否则优先使用sync,这是因为sync是JVM实现的一种锁机制,JVM原生地支持它,而ReentrantLock不是所有的JDK都支持,并且使用sync不用担心没有释放锁而导致死锁问题,因为JVM会确保锁的释放

5.线程之间的协作

当多个线程可以一起工作去解决某个问题时,如果某些部分必须在其它部分之前完成,那么就需要线程进行协调

5.1 join()

在线程中调用另一个线程的join()方法,会将当前线程挂起,而不是忙等待,知道目标线程结束

对于以下代码,虽然b线程先启动,但是因为b线程中调用了a线程的join()方法,b线程会等待a线程结束才继续执行,因此最后能够保证a线程的输出先于b线程的输出

public class JoinExample {

    private class A extends Thread {
        @Override
        public void run() {
            System.out.println("A");
        }
    }

    private class B extends Thread {

        private A a;

        B(A a) {
            this.a = a;
        }

        @Override
        public void run() {
            try {
                a.join();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            System.out.println("B");
        }
    }

    public void test() {
        A a = new A();
        B b = new B(a);
        b.start();
        a.start();
    }
}
public static void main(String[] args) {
    JoinExample example = new JoinExample();
    example.test();
}

AB

5.2 wait() notify() notifyAll()

调用wait()使得线程等待某个条件满足,线程再等待时会被挂起,当其它线程的运行使得这个条件满足时,其它线程会调用notify()或者notifyAll()来唤醒挂起的线程

它们都属于Object的一部分,而不属于Thread

只能用在同步方法或者同步控制块中使用,否则会再运行时抛出IllegalMonitorStateException

使用wait()挂起期间,线程会释放锁。这是因为,如果没有释放锁,那么其它线程就无法进入对象的同步方法或者同步控制块中,那么就无法执行notify()或者notifyAll()来唤醒挂起的线程,造成死锁

public class WaitNotifyExample {

    public synchronized void before() {
        System.out.println("before");
        notifyAll();
    }

    public synchronized void after() {
        try {
            wait();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.out.println("after");
    }
}
public static void main(String[] args) {
    ExecutorService executorService = Executors.newCachedThreadPool();
    WaitNotifyExample example = new WaitNotifyExample();
    executorService.execute(() -> example.after());
    executorService.execute(() -> example.before());
}

before after

5.3 wait 和 sleep()区别

  • wait()是Object方法,而sleep()是Thread的静态方法
  • wait()会释放锁,sleep()不会

5.4 await() signal() signalAll()

JUC类库中提供了Conditon类来实现线程之间的协调,可以再Condition上调用await()方法使线程等待,其它线程调用signal()或signalAll()方法唤醒等待的线程

相比于wait()这种等待方式,await()可以指定等待的条件,因为更加灵活

使用Lock来获得一个Condition对象

public class AwaitSignalExample {

    private Lock lock = new ReentrantLock();
    private Condition condition = lock.newCondition();

    public void before() {
        lock.lock();
        try {
            System.out.println("before");
            condition.signalAll();
        } finally {
            lock.unlock();
        }
    }

    public void after() {
        lock.lock();
        try {
            condition.await();
            System.out.println("after");
        } catch (InterruptedException e) {
            e.printStackTrace();
        } finally {
            lock.unlock();
        }
    }
}
public static void main(String[] args) {
    ExecutorService executorService = Executors.newCachedThreadPool();
    AwaitSignalExample example = new AwaitSignalExample();
    executorService.execute(() -> example.after());
    executorService.execute(() -> example.before());
}

before after

6.线程状态

一个线程只能处于一种状态,并且这里的线程状态特指java虚拟机的线程状态,不能反映线程再特定操作系统下的状态

  • 创建(NEW)

创建后尚未启动

  • 可运行(RUNABLE)

正在Java虚拟机中运行,但是再操作系统层面,它可能处于运行状态,也可能等待资源调度(例如处理器资源),资源调用完成就进入运行状态。所以该状态的可运行是指可以被运行,具体有没有运行要底层操作系统的资源调度

  • 阻塞(BLOCKED)

请求获取monitor lock从而进入sync函数或者代码块,但是其它线程已经占用了该monitor lock,所以处于阻塞状态,要结束该状态进入从而RUNABLE需要其它线程释放monitor lock

  • 无限期等待(WAITING)

等待其它线程显示地唤醒

阻塞和等待的区别在于,阻塞时被动的,它是在等待获取monitor lock,而等待时主动的,通过调用Object.wait()等方法进入

进入方法退出方法
没有设置Timeout参数的Object.wait()方法Object.notify()
Object.notifyAll()
没有设置Timeout参数的Thread.join()方法被调用的线程执行完毕
LockSupport方法LockSupport.unpark(Thread
  • 限期等待(TIMED_WAITING)

无需等待其它线程显示地唤醒,在一定时间之后被系统自动唤醒

进入方法推出方法
Thread.sleep()方法时间结束
设置了Timeout参数的Object.wait()方法时间结束
Object.notify()
Object.notifyAll()
设置了Timeout参数的Thread.join()方法时间结束
被调用的线程执行完毕
LockSupport.parkNanos()方法LockSupport.unpark(Thread)
LockSupport.parkUntil()方法LockSupport(thread)

调用Thread.sleep()方法使线程进入限期等待状态时,常常用"使用一个线程睡眠"进行描述。调用Object.wait()方法使线程进入限期等待或者无限期等待时,常常用"挂起一个线程进行描述"。睡眠和挂起是用来描述行为,而阻塞和等待用来描述状态

  • 死亡(TERMINATED)

可以时线程结束任务之后自己结束,或者产生了异常而结束

7.JUC - AQS

JUC大大提高了并发性能,AQS被认为JUC的核心

7.1 CountDownLatch

用来控制一个或者多个线程等待多个线程

维护了一个计数器cnt,每次调用countDown()方法会让计数器的值减一,减到哦的时候,那些因为调用await()方法而再等待的线程就会被唤醒

image.png

public class CountdownLatchExample {

    public static void main(String[] args) throws InterruptedException {
        final int totalThread = 10;
        CountDownLatch countDownLatch = new CountDownLatch(totalThread);
        ExecutorService executorService = Executors.newCachedThreadPool();
        for (int i = 0; i < totalThread; i++) {
            executorService.execute(() -> {
                System.out.print("run..");
                countDownLatch.countDown();
            });
        }
        countDownLatch.await();
        System.out.println("end");
        executorService.shutdown();
    }
}

run..run..run..run..run..run..run..run..run..run..end

7.2 CyclicBarrier

用来控制多个线程互相等待,只有当多个线程都到达时,这些线程才会继续执行

和CountDownLatch相似,都是通过维护计数器来实现的,线程执行await()方法之后计数器会减一,并进行等待,直到计数器为0,所有调用await()方法而在等待的线程才能继续执行

CyclicBarrier 和 CountDownLatch的区别是,CyclicBarrier的计数器通过调用reset()方法可以循环使用,所以它才叫做循环屏障

CyclicBarrier有两个构造函数,其中parties指示计数器的初始值,barrierAction再所有线程都到达屏障的时候会执行一次

public CyclicBarrier(int parties, Runnable barrierAction) {
    if (parties <= 0) throw new IllegalArgumentException();
    this.parties = parties;
    this.count = parties;
    this.barrierCommand = barrierAction;
}

public CyclicBarrier(int parties) {
    this(parties, null);
}

image.png

public class CyclicBarrierExample {

    public static void main(String[] args) {
        final int totalThread = 10;
        CyclicBarrier cyclicBarrier = new CyclicBarrier(totalThread);
        ExecutorService executorService = Executors.newCachedThreadPool();
        for (int i = 0; i < totalThread; i++) {
            executorService.execute(() -> {
                System.out.print("before..");
                try {
                    cyclicBarrier.await();
                } catch (InterruptedException | BrokenBarrierException e) {
                    e.printStackTrace();
                }
                System.out.print("after..");
            });
        }
        executorService.shutdown();
    }
}

before..before..before..before..before..before..before..before..before..before..after..after..after..after..after..after..after..after..after..after..

7.3 Semaphore

Semaphore类似于操作系统中的信号量,可以控制对互斥资源的访问线程数

以下代码模拟了对某个服务的并发请求,每次只能有3个客户端同时访问,请求总数为10

public class SemaphoreExample {

    public static void main(String[] args) {
        final int clientCount = 3;
        final int totalRequestCount = 10;
        Semaphore semaphore = new Semaphore(clientCount);
        ExecutorService executorService = Executors.newCachedThreadPool();
        for (int i = 0; i < totalRequestCount; i++) {
            executorService.execute(()->{
                try {
                    semaphore.acquire();
                    System.out.print(semaphore.availablePermits() + " ");
                } catch (InterruptedException e) {
                    e.printStackTrace();
                } finally {
                    semaphore.release();
                }
            });
        }
        executorService.shutdown();
    }
}

2 1 2 2 2 2 2 1 2 2

8.JUC-其它组件

8.1 FutureTask

在介绍Callable时我们知道它可以有返回值,返回值通过Future<V>进行封装。FutureTask实现了RunnableFuture接口,该接口继承自Runnable和Future<v>接口,这使得FutureTask既可以当作一个任务执行,也可以有返回值

public class FutureTask<V> implements RunnableFuture<V>

public interface RunnableFuture<V> extends Runnable, Future<V>

FuturTask可以用于异步获取执行结果或取消执行任务的场景。当一个计算任务需要执行很长时间,那么就可以用FutrueTask来封装这个任务,主线程再完成自己的任务之后再去获取结果

public class FutureTaskExample {

    public static void main(String[] args) throws ExecutionException, InterruptedException {
        FutureTask<Integer> futureTask = new FutureTask<Integer>(new Callable<Integer>() {
            @Override
            public Integer call() throws Exception {
                int result = 0;
                for (int i = 0; i < 100; i++) {
                    Thread.sleep(10);
                    result += i;
                }
                return result;
            }
        });

        Thread computeThread = new Thread(futureTask);
        computeThread.start();

        Thread otherThread = new Thread(() -> {
            System.out.println("other task is running...");
            try {
                Thread.sleep(1000);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        });
        otherThread.start();
        System.out.println(futureTask.get());
    }
}
other task is running...
4950

8.2 BolckingQueue

JUC.BlockingQueue接口有以下阻塞队列的实现:

  • FIFO队列: LinkedBlockingQueue ArrayBlockingQueue(固定长度)
  • 优先级队列: PriorityBlockingQueue

提供了阻塞的take()和put()方法: 如果队列为空take()将阻塞,直到队列中有内容;如果队列为满put()将会阻塞,直到队列有空闲位置

使用BlockingQueue实现生产者消费者问题

public class ProducerConsumer {

    private static BlockingQueue<String> queue = new ArrayBlockingQueue<>(5);

    private static class Producer extends Thread {
        @Override
        public void run() {
            try {
                queue.put("product");
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            System.out.print("produce..");
        }
    }

    private static class Consumer extends Thread {

        @Override
        public void run() {
            try {
                String product = queue.take();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            System.out.print("consume..");
        }
    }
}
public static void main(String[] args) {
    for (int i = 0; i < 2; i++) {
        Producer producer = new Producer();
        producer.start();
    }
    for (int i = 0; i < 5; i++) {
        Consumer consumer = new Consumer();
        consumer.start();
    }
    for (int i = 0; i < 3; i++) {
        Producer producer = new Producer();
        producer.start();
    }
}

produce..produce..consume..consume..produce..consume..produce..consume..produce..consume..

8.3 ForkJoin

主要用于并行计算中,和MapReduce原理类似,都是把大的计算任务拆分成多个小任务并行计算

public class ForkJoinExample extends RecursiveTask<Integer> {

    private final int threshold = 5;
    private int first;
    private int last;

    public ForkJoinExample(int first, int last) {
        this.first = first;
        this.last = last;
    }

    @Override
    protected Integer compute() {
        int result = 0;
        if (last - first <= threshold) {
            // 任务足够小则直接计算
            for (int i = first; i <= last; i++) {
                result += i;
            }
        } else {
            // 拆分成小任务
            int middle = first + (last - first) / 2;
            ForkJoinExample leftTask = new ForkJoinExample(first, middle);
            ForkJoinExample rightTask = new ForkJoinExample(middle + 1, last);
            leftTask.fork();
            rightTask.fork();
            result = leftTask.join() + rightTask.join();
        }
        return result;
    }
}
public static void main(String[] args) throws ExecutionException, InterruptedException {
    ForkJoinExample example = new ForkJoinExample(1, 10000);
    ForkJoinPool forkJoinPool = new ForkJoinPool();
    Future result = forkJoinPool.submit(example);
    System.out.println(result.get());
}

ForkJoin使用ForkJoinPool来启动,它是一个特殊的线程池,线程数取决于CPU核数

public class ForkJoinPool extends AbstractExecutorService

ForkJoinPool实现了工作窃取算法来提高CPU的利用率。每个线程都维护了一个双端队列,用来存储需停执行的任务。工作窃取算法允许空闲的线程从其它线程的双端队列窃取一个任务来执行。窃取的任务必须是最晚的任务,避免和队列所属线程发生竞争。

  • 例如下图中,Thread2从Thread1的队列拿出最晚的Task1任务,Thread1会拿出Task2来执行,这样就避免发生竞争,但是如果队列中只有一个任务时还是会发生竞争

image.png

9.线程不安全实例

如果多个线程对同一个共享数据进行访问而不采取同步操作的话,那么操作的结果是不一致的

以下代码演示了1000个线程同时对cnt执行自增操作,操作结束之后它的值有可能小于1000

public class ThreadUnsafeExample {

    private int cnt = 0;

    public void add() {
        cnt++;
    }

    public int get() {
        return cnt;
    }
}
public static void main(String[] args) throws InterruptedException {
    final int threadSize = 1000;
    ThreadUnsafeExample example = new ThreadUnsafeExample();
    final CountDownLatch countDownLatch = new CountDownLatch(threadSize);
    ExecutorService executorService = Executors.newCachedThreadPool();
    for (int i = 0; i < threadSize; i++) {
        executorService.execute(() -> {
            example.add();
            countDownLatch.countDown();
        });
    }
    countDownLatch.await();
    executorService.shutdown();
    System.out.println(example.get());
}

997

10.内存模型

Java内存模型视图屏蔽各种硬件和操作系统的内存访问差异,以实现让Java程序再各种平台下都能达到一致的内存访问

10.1 主内存与工作内存

处理器上的寄存器的读写速度比内存快几个数量级,为了解决这种速度矛盾,在它们之间加入了高速缓存

加入高速缓存带来了一个新的问题: 缓存一致性,如果多个缓存共享同一块主内存区域,那么多个缓存的数据可能会不一致,需要一些协议来解决这个问题

image.png

所有的变量都存储在主内存中,每个线程还有自己的工作内存,工作内存存储在高速缓存或者寄存器中,保存了该线程使用的变量的主内存副本拷贝

线程只能直接操作工作内存中的变量,不同线程之间的变量值传递需要通过主内存来完成

image.png

10.2 内存间交互操作

Java内存模型定义了8个操作来完成主内存和工作内存的交互操作

image.png

  • read: 把一个变量值从主内存传输到工作内存中
  • load: 在read之后执行,把read得到的值放入工作内存的变量副本中
  • use: 把工作内存中一个变量的值传递给执行引擎
  • assign: 把一个从执行引擎接收到的值传送到主内存中
  • store: 把工作内存的一个变量的值传送到主内存中
  • write: 在store之后执行,把store得到的值放入主内存的变量中
  • lock: 作用于主内存的变量
  • unlock

10.3 内存模型三大特征

10.3.1 原子性

Java内存模型保证了readload、use、assign、storewrite、lock 和 unlock 操作具有原子性,例如对一个int类型的变量执行assign赋值操作,这个操作就是原子性的。但是Java内存模型允许虚拟机将没有被volatile修饰的64位数据(long,double)的读写操作划分为两次32位的操作来进行,即load、store、read和write操作可以不具备原子性

有一个错误认识就是,int等原子性的类型在多线程环境中不会出现线程安全问题。前面的线程不安全实例代码中,cnt属于int类型变量,1000个线程对它进行自增操作之后,得到的值是997而不是1000

为了方便讨论,将内存间的交互操作简化为3个: load、assign、store

下图演示了两个线程同时对cnt进行操作,load、assign、store这一系列操作整体上看不具备原子性,那么在T1修改cnt并且还没有将修改后的值写入主内存,T2依然可以读入旧值。可以看出,这两个线程虽然执行了两次自增运算,但是主内存中cnt的值最后为1而不是2。因此对int类型读写操作满足原子性只是说明load、assign、store这些单个操作具备原子性

image.png

AtomicInteger能保证多个线程修改的原子性

image.png

使用 AtomicInteger 重写之前线程不安全的代码之后得到以下线程安全实现:

public class AtomicExample {
    private AtomicInteger cnt = new AtomicInteger();

    public void add() {
        cnt.incrementAndGet();
    }

    public int get() {
        return cnt.get();
    }
}
public static void main(String[] args) throws InterruptedException {
    final int threadSize = 1000;
    AtomicExample example = new AtomicExample(); // 只修改这条语句
    final CountDownLatch countDownLatch = new CountDownLatch(threadSize);
    ExecutorService executorService = Executors.newCachedThreadPool();
    for (int i = 0; i < threadSize; i++) {
        executorService.execute(() -> {
            example.add();
            countDownLatch.countDown();
        });
    }
    countDownLatch.await();
    executorService.shutdown();
    System.out.println(example.get());
}

1000

除了使用原子类之外,也可以使用 synchronized 互斥锁来保证操作的原子性。它对应的内存间交互操作为:lock 和 unlock,在虚拟机实现上对应的字节码指令为 monitorentermonitorexit

public class AtomicSynchronizedExample {
    private int cnt = 0;

    public synchronized void add() {
        cnt++;
    }

    public synchronized int get() {
        return cnt;
    }
}
public static void main(String[] args) throws InterruptedException {
    final int threadSize = 1000;
    AtomicSynchronizedExample example = new AtomicSynchronizedExample();
    final CountDownLatch countDownLatch = new CountDownLatch(threadSize);
    ExecutorService executorService = Executors.newCachedThreadPool();
    for (int i = 0; i < threadSize; i++) {
        executorService.execute(() -> {
            example.add();
            countDownLatch.countDown();
        });
    }
    countDownLatch.await();
    executorService.shutdown();
    System.out.println(example.get());
}

1000

10.3.2 可见性

可见性值当一个线程修改了共享变量的值,其它线程能够立即得知这个修改。Java内存模型是通过在变量修改后将值同步回主内存,在变量读取前从主内存刷新变量值来实现可见性

主要用三种实现可见性的方式:

  • volatile
  • synchronized,对一个变量执行unlock操作前,必须把变量值同步回主内存
  • final,被final关键字修饰的字段在构造器中一旦初始化完成,并且没有发生this逃逸(其它线程通过this引用访问到初始化了一半的对象),那么其它线程能看见final字段的值

10.3.3 有序性

有序性是指: 在本线程内观察,所有操作都是有序的。在一个线程观察另一个线程,所有操作都是无序的,无序是因为发生了指令重排序。Java内存模型中,允许编译器和处理器对指令进行重排序,重排序过程不会影响到单线程程序的执行,却会影响到多线程并发执行的正确性

volatile关键字通过添加内存屏障的方式来禁止指令重排,即重排序时不能把后面的指令放到内存屏障之前

也可以通过sync来保证有序性,它保证每个时刻只有一个线程执行同步代码,相当于让线程顺序执行同步代码

10.4 先行发生原则

上面提到了可以使用volatile和sync来保证有序性。除此之外,JVM还规定了先行发生原则,让一个操作无需控制就能先于另一个操作完成

10.4.1 单一线程原则

Single Thread rule

在一个线程内,在程序前面的操作先行发生于后面的操作

image.png

10.4.2 管程锁定规则

Monitor Lock Rule

一个unlock操作先行发生于后面对同一个锁的lock操作

image.png

10.4.3 volatile变量规则

volatile Variable Rule

对一个volatile变量的写操作先行发生于后面对这个变量的读操作

image.png

10.4.4 线程启动规则

Thread Start Rule

Thread对象的start()方法调用先行发生于此线程的每一个动作

image.png

10.4.5 线程加入规则

Thread Join Rule

Thread对象的结束先行发生于join()方法返回

image.png

10.4.6 线程中断规则

Thread Interruption Rule

对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件发生,可以通过interrupt()方法检测到是否有中断发生

10.4.7 对象终结原则

Finalizer Rule

一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始

10.4.8 传递性

Transitivity

如果操作A先行发生于操作B,操作B先行发生于操作C,那么操作A先行于操作C

11.线程安全

多个线程不管以何种方式访问某个类,并且在主调代码中不需要进行同步,都能表现正确的行为。

线程安全有以下几种实现方式

11.1 不可变

不可变(Immutable)的对象一定是线程安全的,不需要采取任何的线程安全保障措施。只要一个不可变的对象被正确地构建出来,永远也不会看到它在多个线程之中处于不一致的状态。多线程环境下,应当尽量使对象称为不可变,来满足线程安全

不可变的类型:

  • final关键字修饰的基本数据类型
  • String
  • 枚举类型
  • Number部分类,如Long和Double等数值包装类型,BigInteger和BigDecimal等大数据类型。但同为Number的原子类AtomicInterger和AtomicLong则是可变的

对于集合类型,可以使用Collections,unmodifiableXXX()方法来获取一个不可变的集合

public class ImmutableExample {
    public static void main(String[] args) {
        Map<String, Integer> map = new HashMap<>();
        Map<String, Integer> unmodifiableMap = Collections.unmodifiableMap(map);
        unmodifiableMap.put("a", 1);
    }
}
Exception in thread "main" java.lang.UnsupportedOperationException
    at java.util.Collections$UnmodifiableMap.put(Collections.java:1457)
    at ImmutableExample.main(ImmutableExample.java:9)

Collection.unmodifiableXXX()先对原始的集合进行拷贝,需要对集合进行修改的方法都是直接抛出异常

public V put(K key, V value) {
    throw new UnsupportedOperationException();
}

11.2 互斥同步

sync和ReentrantLock

11.3 非阻塞同步

互斥同步最主要的问题就是线程阻塞和唤醒所带来的性能问题,因此这种同步也成为阻塞同步

互斥同步属于一种悲观的并发策略,总是认为只要不去做正确的同步措施,那就肯定会出现问题。无论共享数据是否真的会出现竞争,它都要进行加锁(这里讨论的是概念模型,实际上虚拟机会优化掉很大一部分不必要的加锁)、用户态核心态转换、维护锁计数器和检查是否有被阻塞的线程需要唤醒等操作

随着硬件指令集的发展,我们可以使用基于冲突检测的乐观并发策略: 先进行操作,如果没有其它线程争用共享数据,那操作就成功了,否则采取补偿措施(不断地重试,直到成功为止)。这种乐观的并发策略的许多实现都不需要将线程阻塞,因此这种同步操作称为非阻塞同步

11.3.1 CAS

乐观锁需要操作和冲突检测这两个步骤具有原子性,这里就不能使用互斥锁同步来保证了,只能靠硬件来完成。硬件支持的原子性操作最典型的是CAS,CAS指令需要3个操作数,分别是内存地址V,旧的预期值A和新值B。当执行操作时,只有当V的值等于A,才能将V的值更新为B

11.3.2 AtomicInteger

JUC包里面的整数原子类AtomicInteger的方法调用了Unsafe类的CAS操作

以下代码使用了AtomicInteger执行了自增的操作

private AtomicInteger cnt = new AtomicInteger();

public void add() {
    cnt.incrementAndGet();
}

以下代码是incrementAndGet()的源码,它调用了Unsafe的getAndAddInt()

public final int incrementAndGet() {
    return unsafe.getAndAddInt(this, valueOffset, 1) + 1;
}

以下代码是getAndAddInt()源码,var1指示对象内存地址,var2指示该字段相对对象内存地址的偏移,var4指示操作需要加的数值,这里为1。通过getIntVolatile(var1,var2)得到旧的预期值,通过compareAndSwapInt()来进行CAS比较,如果该字段内存地址的值等于var5,那么就更新内存地址var1+var2的变量为var5+var4

可以看到getAndAddInt()在一个循环中进行,发生冲突的方法是不断的进行重试

public final int getAndAddInt(Object var1, long var2, int var4) {
    int var5;
    do {
        var5 = this.getIntVolatile(var1, var2);
    } while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));

    return var5;
}

11.3.3 ABA

如果一个变量初次读取的时候是 A 值,它的值被改成了 B,后来又被改回为 A,那 CAS 操作就会误认为它从来没有被改变过。

J.U.C 包提供了一个带有标记的原子引用类 AtomicStampedReference 来解决这个问题,它可以通过控制变量值的版本来保证 CAS 的正确性。大部分情况下 ABA 问题不会影响程序并发的正确性,如果需要解决 ABA 问题,改用传统的互斥同步可能会比原子类更高效

11.4 无同步方案

要保证线程安全,并不是一定就要进行同步。如果一个方法本来就不涉及共享数据,那它自然就无须任何同步措施去保证正确性

11.4.1 栈封闭

多个线程访问同一个方法的局部变量时,不会出现线程安全问题,因为局部变量存储在虚拟机栈中,属于线程私有的

public class StackClosedExample {
    public void add100() {
        int cnt = 0;
        for (int i = 0; i < 100; i++) {
            cnt++;
        }
        System.out.println(cnt);
    }
}
public static void main(String[] args) {
    StackClosedExample example = new StackClosedExample();
    ExecutorService executorService = Executors.newCachedThreadPool();
    executorService.execute(() -> example.add100());
    executorService.execute(() -> example.add100());
    executorService.shutdown();
}

100 100

11.4.2 线程本地存储 (Thread Local Storage)

如果一段代码中所需要的数据必须于其它代码共享,那就看看这些共享数据的代码是否能保证在同一个线程中执行。如果能保证,我们就可以把共享数据的可见范围限制在同一个线程之内,这样,无需同步也能保证线程之间不出现数据争用的问题

符合这种特点的应用并不少见,大部分使用消费队列的架构模式(如“生产者-消费者”模式)都会将产品的消费过程尽量在一个线程中消费完。其中最重要的一个应用实例就是经典Web交互模型中的"一个请求对应一个服务器线程"(Thread-per-Request)的处理方式,这种处理方式的广泛应用使得很多Web服务端应用都可以使用线程本地存储来解决线程安全问题

可以使用Java.lang.ThreadLocal类来实现线程本地存储功能

对于以下代码,thread1中设置threadLocal为1,而thread设置为threadlocal为2。过了一段时间之后,thread1读取threadlocal依然是1,不受thread2

public class ThreadLocalExample {
    public static void main(String[] args) {
        ThreadLocal threadLocal = new ThreadLocal();
        Thread thread1 = new Thread(() -> {
            threadLocal.set(1);
            try {
                Thread.sleep(1000);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            System.out.println(threadLocal.get());
            threadLocal.remove();
        });
        Thread thread2 = new Thread(() -> {
            threadLocal.set(2);
            threadLocal.remove();
        });
        thread1.start();
        thread2.start();
    }
}

1

为了理解 ThreadLocal,先看以下代码:

public class ThreadLocalExample1 {
    public static void main(String[] args) {
        ThreadLocal threadLocal1 = new ThreadLocal();
        ThreadLocal threadLocal2 = new ThreadLocal();
        Thread thread1 = new Thread(() -> {
            threadLocal1.set(1);
            threadLocal2.set(1);
        });
        Thread thread2 = new Thread(() -> {
            threadLocal1.set(2);
            threadLocal2.set(2);
        });
        thread1.start();
        thread2.start();
    }
}

它对应的底层结构图为:

image.png

每个Thread都有一个ThreadLocal.ThreadLocalMap对象

/* ThreadLocal values pertaining to this thread. This map is maintained
 * by the ThreadLocal class. */
ThreadLocal.ThreadLocalMap threadLocals = null;

当调用一个ThreadLocal的Set(T value)方法时,先得到当前线程的ThreadLoaclMap对象,然后将ThreadLocal->value键值对插入到该Map中

public void set(T value) {
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null)
        map.set(this, value);
    else
        createMap(t, value);
}

get()方法类似

public T get() {
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null) {
        ThreadLocalMap.Entry e = map.getEntry(this);
        if (e != null) {
            @SuppressWarnings("unchecked")
            T result = (T)e.value;
            return result;
        }
    }
    return setInitialValue();
}

ThreadLocal 从理论上讲并不是用来解决多线程并发问题的,因为根本不存在多线程竞争

有一些场景(尤其是使用线程池)下,由于ThreadLocal.ThreadLocalMap的底层数据结构导致ThreadLocal有内存泄露的情况,应该尽可能在每次使用ThreadLocal后手动调用remove(),以免出现ThreadLocal经典的内存泄露甚至是造成自身业务混乱的风险

11.4.3 可重入代码块(Reentrant Code)

这种代码也叫做纯代码(Pure Code),可以在代码执行的任何时刻中断它,转而去执行另外一段代码(包括递归调用它本身),而在控制权返回后,原来的程序不会出现任何错误

可重入代码一些共同得分特征,例如不依赖存储在堆上的数据和公用的系统资源、用到的状态量都由参数中传入、不调用非可重入的方法等

12.锁优化

这里的锁优化主要是指JVM对sync的优化

12.1 自旋锁

互斥同步进入阻塞状态的开销都很大,应该尽量避免。在许多应用中,共享数据的锁定状态只会持续很短的一段事件。自旋锁的思想是让一个人线程在请求一个共享数据的锁时执行忙循环(自旋)一段事件,如果在这段时间内能获得锁,就可以避免进入阻塞状态

自旋锁虽然能避免进入阻塞状态从而减少开销,但是它需要进行忙循环操作占用CPU事件,它只适用于共享数据的锁定状态很短的场景

在JDK6中引入了自适应的自旋锁。自适应意味着自选的次数不再固定了,而是由前一次在同一个锁上的自旋次数及锁的拥有者的状态来决定

12.2 锁消除

锁消除是指对于被检测出不可能存在竞争的共享数据的锁进行消除

锁消除主要是通过逃逸分析来支持,如果堆上的共享数据不可能逃逸出去被其它线程访问到,那么就可以把它们当成私有数据对待,也就可以将它们的锁进行消除

对于一些看起来没有加锁的代码,其实隐式的加了很多锁,例如下面的字符串拼接代码就隐式加了锁

public static String concatString(String s1, String s2, String s3) {
    return s1 + s2 + s3;
}

String 是一个不可变的类,编译器会对 String 的拼接自动优化。在 JDK 1.5 之前,会转化为 StringBuffer 对象的连续 append() 操作:

public static String concatString(String s1, String s2, String s3) {
    StringBuffer sb = new StringBuffer();
    sb.append(s1);
    sb.append(s2);
    sb.append(s3);
    return sb.toString();
}

每个append()方法中都有一个同步块。虚拟机观察sb,很快就会发现它的动态作用域被限制在concatString()方法内部。也就是说,sb的所有引用永远不会逃逸到concatString()方法之外,其它线程无法访问到它,因此可以进行消除

12.3 锁粗化

如果一系列的连续操作都对同一个对象反复加锁和解锁,频繁的加锁操作就会导致性能损耗

上一节的示例代码中连续的append()方法就是属于这种情况。如果虚拟机探测到由这样的一串零碎的操作都对同一个对象加锁,将会把加锁的范围扩展(粗化)到整个操作序列的外部。对于上一届的示例代码就是扩展到第一个append()操作之前直到最后一个append()操作之后,这样只需要加锁一次就可以了

12.4 轻量级锁

JDK6中引入了偏向锁和轻量级锁,从而让锁拥有了四个状态: 无锁状态(unlocked)、偏向锁状态(biasble)、轻量级锁状态(lightweight locked)和重量级锁(inflated)

以下是HotSpot虚拟机对象头的内存布局,这些数据被称为Mark Word。其中tag bits对应了5个状态,这些状态在右侧的state表格中给出。除了marked for gc状态,其它四个状态已经在前面介绍过了

image.png

下图左侧是一个线程的虚拟机栈,其中有一部分称为Lock Record的区域,这是轻量级锁运行过程创建的,用于放锁对象的Mark Word。右侧就是一个锁对象,包含了Mark Word和其它信息

image.png

轻量级锁时相对于传统的重量级锁而言,它使用CAS操作来避免重量级锁使用互斥量的开销。对于绝大部分的锁,在整个同步周期内部是不存在竞争的,因此也就不需要都是用互斥量进行同步,可以先采用CAS操作进行同步,如果CAS失败了再改用互斥量进行同步

当场是获取一个锁对象时,如果锁对象标记为 0 01 , 说明锁对象未锁定(unlocked)状态,此时虚拟机再当前线程的虚拟机栈中创建Lock Record,然后使用CAS操作将对象的Mark Word更新为Lock Record指针。如果CAS操作成功了,那么线程就获取了该对象上的锁,并且对象的Mark Word的锁标记变为00,表示该对象处于轻量级锁状态

image.png

如果CAS操作失败了,虚拟机首先会检查对象的Mark Word是否指向当前线程的虚拟机栈,如果是的话说明当前线程已经拥有了锁对象,那就可以直接进入同步块继续执行,否则说明这个锁对象被其它线程抢占了。如果两条以上的线程争用同一个锁,那轻量级锁就不再有效,要膨胀为重量级锁

12.5 偏向锁

偏向锁的思想是偏向于让第一个获取锁对象的线程,这个线程再之后获取该锁就不再需要进行同步操作,甚至连CAS操作也不需要

当锁对象第一次被线程获得的时候,进入偏向状态,标记为1 01 。同时使用CAS操作将线程ID记录到Mark Word中,如果CAS操作成功,这个线程以后每次进入这个锁相关的同步块就不需要再进行任何同步操作

当有另一个线程去尝试获取这个锁对象时,偏向状态就宣告结束,此时撤销偏向(Revoke Bias)后恢复到未锁定状态或者轻量级锁状态

image.png

13.多线程开发良好实践

  • 给线程起个有意义的名字,这样方便找bug
  • 缩小同步范围,从而减少锁竞争,例如对于sync,应该尽量使用同步代码块,而不是同步类
  • 多使用同步工具少使用wait()和notify()。首先,CountDownLatch,CyclicBarrier,Semaphore和Exchanger这些同步类简化了编码操作,而用wait()和notify()很难实现复杂控制流;其次这些同步类是由最好的企业编写和维护,在后续的JDK中不断优化和完善
  • 使用BlockingQueue实现生产者消费者问题
  • 多用并发集合少用同步集合,例如应该使用ConcurrentHashMap而不是HashTabale
  • 使用本地变量和不可变类来保证线程安全
  • 使用线程池而不是直接创建线程,这是因为创建线程代价很高,线程池可以有效地利用有限的线程来启动任务。