多线程使用

141 阅读12分钟

微信入群一块学习技术:Day9884125

一、背景

   在Java多线程编程中,线程池被广泛使用,在日常开发中甚至成为标配。多线程期望达到的目标是异步执行并发执行
   线程池本质是池化技术,和连接池类似,创建连接与关闭连接属于耗时操作,创建线程与销毁线程也属于耗时重操作。为了提高效率,先提前创建好一批线程,当有需要使用线程时从线程池取出,用完后放回线程池,这样避免了频繁创建与销毁线程。

// 任务
Runnable runnable = () -> System.out.println(Thread.currentThread().getId());

   在应用中优先选用线程池执行异步任务,根据不同的场景选用不同的线程池,提高异步任务执行效率。

1.1 普通执行

new Thread(runnable).start();

1.2 线程池执行

Executors.newSingleThreadExecutor().execute(runnable)

二、线程池基础

2.1 核心参数

2.1.1 核心参数

线程池的核心参数决定了池的类型,进而决定了池的特性。

参数解释行为
corePoolSize核心线程数池中长期维护的线程数量,不主动回收
maximumPoolSize最大线程数最大线程数大于等于核心线程数
keepAliveTime线程最大空闲时间非核心线程最大空闲时间,超时回收线程
workQueue工作队列工作队列直接决定线程池的类型

2.1.2 参数与池的关系

Executors类默认创建线程池与参数对应关系。

线程池corePoolSizemaximumPoolSizekeepAliveTimeworkQueue
newCachedThreadPool0Integer.MAX_VALUE60SynchronousQueue
newSingleThreadExecutor110LinkedBlockingQueue
newFixedThreadPoolNN0LinkedBlockingQueue
newScheduledThreadPoolNInteger.MAX_VALUE0DelayedWorkQueue

2.2 线程池对比

根据使用场景选择对应的线程池。

2.2.1 通用对比

线程池特点适用场景
newCachedThreadPool超时未使用的线程回自动销毁,有新任务时自动创建适用于低频、集中式任务。回收线程的目的是节约线程长时间空闲而占有的资源。
newSingleThreadExecutor线程池中有且只有一个线程异步顺序执行任务
newFixedThreadPool线程池中有固定数量的线程,且一直存在适用于高频的任务,即线程在大多数时间里都处于工作状态。
newScheduledThreadPool定时线程池与定时调度相关联

2.2.2 拓展对比

维护仅有一个线程的线程池有两种方式,下面对比它们之间的相似之处与区别。

private final static ExecutorService single = Executors.newSingleThreadExecutor();
private final static ExecutorService fixed = Executors.newFixedThreadPool(1);

   在正常使用中,线程池singlefixed均只有一个线程,提交到该线程池的任务依次顺序执行。
   不同之处是single在整个生命周期均是单例状态,fixed可以强转为ThreadPoolExecutor类型,进而修改核心线程和最大线程数量。

2.3 线程池原理

线程池ThreadPoolExecutor应用最为广泛,下面分析其原理。

image.png
线程池主要处理流程,任务提交之后是怎么执行的。大致如下:

  • 判断核心线程是否有空闲,如果是,则使用空闲线程执行任务
  • 如果核心线程无空闲,判断队列是否已满,如果队列没满,将任务放在队列中
  • 如果队列已满,则判断当前线程数是否超过最大线程数,如果否,则创建线程执行任务
  • 如果超过最大线程数,则按照拒绝策略对相应正在提交的任务

2.4 提交任务的方式

   往线程池中提交任务,主要有两种方法:提交无返回值的任务和提交有返回值的任务。

2.4.1 无返回值任务

execute用于提交不需要返回结果的任务。

public static void main(String[] args) {
    ExecutorService executor = Executors.newFixedThreadPool(2);
    executor.execute(() -> System.out.println("hello"));
}

2.4.1 有返回值任务

   submit用于提交一个需要返回果的任务。
   该方法返回一个Future对象,通过调用这个对象的get()方法,我们就能获得返回结果。get()方法会一直阻塞,直到返回结果返回。
   我们也可以使用它的重载方法get(long timeout, TimeUnit unit),这个方法也会阻塞,但是在超时时间内仍然没有返回结果时,将抛出异常TimeoutException

public static void main(String[] args) throws Exception {
    ExecutorService executor = Executors.newFixedThreadPool(2);
    Future<Long> future = executor.submit(() -> {
        System.out.println("task is executed");
        return System.currentTimeMillis();
    });
    System.out.println("task execute time is: " + future.get());
}

在提交任务时,如果无返回值任务,优先使用execute方法。

2.5 关闭线程池

   在线程池使用完成之后,我们需要对线程池中的资源进行释放操作,这就涉及到关闭功能。

2.5.1 关闭线程池的意义

   线程池作为任务的管理者,需要优雅的关闭,原因是如果不手动关闭线程池,线程池中正在执行执行的线程以及队列中还未执行任务将会变得极不可控,如果处理不当,可能造成数据丢失,业务请求结果不正确等问题。
   如果业务能够忽略上述影响,那么直接关闭JVM,那么连接池资源会自动释放,不需要手动关闭。

2.5.2 关闭线程池的方式

调用线程池对象的shutdown()shutdownNow()方法来关闭线程池。

  • shutdown()会将线程池状态置为SHUTDOWN,不再接受新的任务,同时会等待线程池中已有的任务执行完成再结束。
  • shutdownNow()会将线程池状态置为SHUTDOWN,对所有线程执行interrupt()操作,清空队列,并将队列中的任务返回回来。 关闭线程池涉及到两个返回boolean的方法,isShutdown()isTerminated,分别表示是否关闭和是否终止。

三、Executors

   Executors是一个线程池工厂,提供了很多的工厂方法,我们来看看它大概能创建哪些线程池。

// 创建单一线程的线程池
public static ExecutorService newSingleThreadExecutor();
// 创建固定数量的线程池
public static ExecutorService newFixedThreadPool(int nThreads);
// 创建带缓存的线程池
public static ExecutorService newCachedThreadPool();
// 创建定时调度的线程池
public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize);
// 创建流式(fork-join)线程池
public static ExecutorService newWorkStealingPool();

3.1 创建单一线程的线程池

   任何时候线程池中至多只有一个线程,当线程执行异常终止时会自动创建一个新线程替换。
   若多个任务被提交到此线程池,那么会被缓存到队列。当线程空闲的时候,按照FIFO的方式进行处理。
   如果既有异步执行任务的需求又希望任务得以顺序执行,那么此类型线程池是首选。

3.2 创建固定数量的线程池

  • 如果核心线程有空闲的,则取出空闲线程执行任务
  • 如果没有核心线程是空闲的,则将任务缓存到队列(队列长度为Integer.MAX_VALUE)。当线程空闲的时候,按照FIFO的方式进行处理
  • 固定数量线程池核心线程数等于最大线程数

3.3 创建可伸缩的线程池

   这种方式创建的线程池,核心线程池的长度为0,线程池最大长度为Integer.MAX_VALUE
   由于本身使用SynchronousQueue作为等待队列的缘故,导致往队列里面每插入一个元素,必须等待另一个线程从这个队列删除一个元素。

  • 线程池可维护0到Integer.MAX_VALUE个线程资源,空闲线程默认情况下超过60秒未使用则会被销毁,长期闲置的池占用较少的资源。
  • 当有新任务加入时,如果池中有空闲且尚未销毁的线程,则将任务交给此线程执行;如果没有可用的线程,则创建一个新线程执行任务并添加到池中。

3.4 创建定时调度的线程池

   和上面3个工厂方法返回的线程池类型有所不同,它返回的是ScheduledThreadPoolExecutor类型的线程池。平时实现定时调度功能的时候,更多的是使用第三方类库,比如:quartz等。

四、手动创建线程池

   尽管可以通过Executors来创建线程池,实际开发中往往更多使用手动创建线程池。手动创建线程池的原因是强制开发者了解更多线程池配置细节,以便更加灵活的使用线程池,避免任务堆积导致OOM。
   下面着重分析ThreadPoolExecutor

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler);

这个构造方法有7个参数,我们逐一来进行分析。

  • corePoolSize,线程池中的核心线程数
  • maximumPoolSize,线程池中的最大线程数
  • keepAliveTime,空闲时间,当线程池数量超过核心线程数时,多余的空闲线程存活的时间,即:这些线程多久被销毁。
  • unit,空闲时间的单位,可以是毫秒、秒、分钟、小时和天,等等
  • workQueue,等待队列,线程池中的线程数超过核心线程数时,任务将放在等待队列,它是一个BlockingQueue类型的对象
  • threadFactory,线程工厂,我们可以使用它来创建一个线程
  • handler,拒绝策略,当线程池和等待队列都满了之后,需要通过该对象的回调函数进行回调处理

4.1 工作队列

   工作队列是BlockingQueue类型的,理论上只要是它的子类,我们都可以用来作为等待队列。常用的工作队列有四种。

  • ArrayBlockingQueue 队列是有界的,基于数组实现的阻塞队列
  • LinkedBlockingQueue 队列可以有界,也可以无界。基于链表实现的阻塞队列
  • SynchronousQueue 不存储元素的阻塞队列,每个插入操作必须等到另一个线程调用移除操作,否则插入操作将一直处于阻塞状态。该队列是Executors.newCachedThreadPool()的默认队列
  • PriorityBlockingQueue 带优先级的无界阻塞队列    通常情况下,我们需要指定阻塞队列的上界(比如1024)。
       如果执行的任务很多,我们可能需要将任务进行分类,然后将不同分类的任务放到不同的线程池中执行

4.2 线程工厂

   ThreadFactory是一个接口,只有一个方法。既然是线程工厂,那么我们就可以用它生产一个线程对象。来看看这个接口的定义。

public interface ThreadFactory {

    /**
     * Constructs a new {@code Thread}.  Implementations may also initialize
     * priority, name, daemon status, {@code ThreadGroup}, etc.
     *
     * @param r a runnable to be executed by new thread instance
     * @return constructed thread, or {@code null} if the request to
     *         create a thread is rejected
     */
    Thread newThread(Runnable r);
}

   Executors的实现使用了默认的线程工厂-DefaultThreadFactory。它的实现主要用于创建一个线程,线程的名字为pool-{poolNum}-thread-{threadNum}

static class DefaultThreadFactory implements ThreadFactory {
    private static final AtomicInteger poolNumber = new AtomicInteger(1);
    private final ThreadGroup group;
    private final AtomicInteger threadNumber = new AtomicInteger(1);
    private final String namePrefix;

    DefaultThreadFactory() {
        SecurityManager s = System.getSecurityManager();
        group = (s != null) ? s.getThreadGroup() :
                              Thread.currentThread().getThreadGroup();
        namePrefix = "pool-" +
                      poolNumber.getAndIncrement() +
                     "-thread-";
    }

    public Thread newThread(Runnable r) {
        Thread t = new Thread(group, r,
                              namePrefix + threadNumber.getAndIncrement(),
                              0);
        if (t.isDaemon())
            t.setDaemon(false);
        if (t.getPriority() != Thread.NORM_PRIORITY)
            t.setPriority(Thread.NORM_PRIORITY);
        return t;
    }
}

很多时候,我们需要自定义线程名字。我们只需要自己实现ThreadFactory,用于创建特定场景的线程即可。

4.3 拒绝策略

所谓拒绝策略,是指当线程池满了、队列也满了的时候,对新提交任务采取的态度。常见如下四种策略:

  • CallerRunsPolicy 在调用者线程执行
  • AbortPolicy 直接抛出RejectedExecutionException异常
  • DiscardPolicy 任务直接丢弃,不做任何处理
  • DiscardOldestPolicy 丢弃队列里最旧的那个任务,再尝试执行当前任务    这四种策略各有优劣,比较常用的是DiscardPolicy。如果需要实现自定义的拒绝策略, 通过实现RejectedExecutionHandler接口的方式来实现。

五、其他

5.1 配置线程池的参数

   前面我们讲到了手动创建线程池涉及到的几个参数,那么我们要如何设置这些参数才算是正确的应用呢?实际上,需要根据任务的特性来分析。

  • 任务的性质:CPU密集型、IO密集型和混杂型
  • 任务的优先级:高中低
  • 任务执行的时间:长中短
  • 任务的依赖性:是否依赖数据库或者其他系统资源    通常来说,如果任务属于CPU密集型,那么我们可以将线程池数量设置成CPU的个数,以减少线程切换带来的开销。如果任务属于IO密集型,我们可以将线程池数量设置得更多一些,比如CPU个数*2。
       PS:我们可以通过Runtime.getRuntime().availableProcessors()来获取CPU的个数。

5.2 线程池监控

   如果系统中大量用到了线程池,那么我们有必要对线程池进行监控。利用监控,我们能在问题出现前提前感知到,也可以根据监控信息来定位可能出现的问题。
   那么我们可以监控哪些信息?又有哪些方法可用于我们的扩展支持呢?
   首先,ThreadPoolExecutor自带了一些方法。

  1. long getTaskCount(),获取已经执行或正在执行的任务数
  2. long getCompletedTaskCount(),获取已经执行的任务数
  3. int getLargestPoolSize(),获取线程池曾经创建过的最大线程数,根据这个参数,我们可以知道线程池是否满过
  4. int getPoolSize(),获取线程池线程数
  5. int getActiveCount(),获取活跃线程数(正在执行任务的线程数)    其次,ThreadPoolExecutor留给我们自行处理的方法有3个,它在ThreadPoolExecutor中为空实现(也就是什么都不做)。
protected void beforeExecute(Thread t, Runnable r) // 任务执行前被调用
protected void afterExecute(Runnable r, Throwable t) // 任务执行后被调用
protected void terminated() // 线程池结束后被调用

六、总结

  • 尽量使用手动的方式创建线程池,避免使用Executors工厂类
  • 根据场景,合理设置线程池的各个参数,包括线程池数量、队列、线程工厂和拒绝策略
  • 在分布式系统中,异步任务更多使用消息队列来实现