Java并发编程-线程池(一)

406 阅读7分钟

这是我参与8月更文挑战的第13天,活动详情查看:8月更文挑战

前言

Java中的线程池是运用场景最多的并发框架,几乎所有需要异步并发执行任务的程序都可以使用线程池。在开发过程中,合理地使用线程池能够带来3个好处。

    1. 降低资源的消耗
    1. 提高响应速度
    1. 提高线程的可管理性

线程池也是一般我们面试中必问的知识点,那本文就聊聊线程池的原理和线程池的使用场景,JDK线程池和Spring线程池的区别.

1. 线程池基本原理

线程池的处理流程和我们日常开发中一些业务复杂场景相比来说并不复杂, 处理流程如下:

线程池基本原理 (3).png

2. 线程池Executor框架

Executor接口是线程池框架中最基础的部分,定义了一个用于执行Runnable的execute方法。

Executor.png

Executor下有一个重要子接口 ExecutorService,定义了线程池的具体行为

image.png

  1. execute(Runnable):执行Runable任务
  2. submit 可用来提交Callable或Runnable任务,并返回代表此任务的Future对象
  3. shutdown 在完成已提交的任务后封闭办事,不再接管新任务
  4. shutdownNow 停止所有正在履行的任务并封闭办事
  5. isTerminated 测试是否所有任务都履行完毕了
  6. isShutdown 测试是否该ExecutorService已被关闭

我们看下 ThreadPoolExecutor 创建线程池

2.1 ThreadPoolExecutor 线程池框架

线程池属性

image.png

ctl 是对线程池的运行状态和线程池中有效线程的数量进行控制的一个字段.

它包含两部分的信息: 线程池的运行状态 (runState) 和线程池内有效线程的数量 (workerCount).

这里可以看到,使用了Integer类型来保存,高3位保存runState,低29位保存workerCount。COUNT_BITS 就是29,CAPACITY就是1左移29位减1(29个1),这个常量表示workerCount的上限值,大约是5亿。

CTL相关的方法

image.png

  • runStateOf:获取运行状态;
  • workerCountOf:获取活动线程数;
  • ctlOf:获取运行状态和活动线程数的值。

2.2 线程池状态

image.png 线程池5种状态

  1. RUNNING
  2. SHUTDOWN
  3. STOP
  4. TIDYING
  5. TERMINATED
2.2.1 RUNNING

(1) 状态说明:线程池处在RUNNING状态时,能够接收新任务,以及对已添加的任务进行处理。
(2) 状态切换:线程池的初始化状态是RUNNING。换句话说,线程池被一旦被创建,就处于RUNNING状态,并且线程池中的任务数为0!

2.2.2 SHUTDOWN

(1) 状态说明:线程池处在SHUTDOWN状态时,不接收新任务,但能处理已添加的任务。
(2) 状态切换:调用线程池的shutdown()接口时,线程池由RUNNING -> SHUTDOWN。

2.2.3 STOP

(1) 状态说明:线程池处在STOP状态时,不接收新任务,不处理已添加的任务,并且会中断正在处理的任务。 (2) 状态切换:调用线程池的shutdownNow()接口时,线程池由(RUNNING or SHUTDOWN ) -> STOP

2.3.4 TIDYING

(1) 状态说明:当所有的任务已终止,ctl记录的”任务数量”为0,线程池会变为TIDYING状态。当线程池变为TIDYING状态时,会执行钩子函数terminated()。terminated()在 ThreadPoolExecutor类中是空的,若用户想在线程池变为TIDYING时,进行相应的处理;可以通过重载terminated()函数来实现。

(2) 状态切换:当线程池在SHUTDOWN状态下,阻塞队列为空并且线程池中执行的任务也为空时,就会由 SHUTDOWN -> TIDYING。 当线程池在STOP状态下,线程池中执行的 任务为空时,就会由STOP -> TIDYING。

2.3.5 TERMINATED

(1) 状态说明:线程池彻底终止,就变成TERMINATED状态。

(2) 状态切换:线程池处在TIDYING状态时,执行完terminated()之后,就会由 TIDYING -> TERMINATED。

进入TERMINATED的条件如下:

  • 线程池不是RUNNING状态;
  • 线程池状态不是TIDYING状态或TERMINATED状态;
  • 如果线程池状态是SHUTDOWN并且workerQueue为空;
  • workerCount为0;
  • 设置TIDYING状态成功。

image.png

2.3 线程池具体实现

从上面的UML图也可以看出, JDK线程池有两种实现

  1. ThreadPoolExecutor 默认线程池
  2. ScheduledThreadPoolExecutor 定时线程池

ThreadPoolExecutor 创建线程池

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler) 

重要参数

2.3.1 corePoolSize

线程池中的核心线程数,当提交一个任务时,线程池创建一个新线程执行任务,直到当前线程数等于corePoolSize;如果当前线程数为corePoolSize,继续提交的任务被保存到阻塞队列中,等待被执行;

如果执行了线程池的prestartAllCoreThreads()方法,线程池会提前创建并启动所有核心线程。

2.3.2 maximumPoolSize

线程池中允许的最大线程数。如果当前阻塞队列满了,且继续提交任务,则创建新的线程执行任务,前提是当前线程数小于maximumPoolSize;

2.3.3 keepAliveTime

线程池维护线程所允许的空闲时间。当线程池中的线程数量大于corePoolSize的时候,如果这时没有新的任务提交,核心线程外的线程不会立即销毁,而是会等待,直到等待的时间超过了keepAliveTime;

2.3.4 unit

keepAliveTime的单位;

2.3.5 workQueue

用来保存等待被执行的任务的阻塞队列,且任务必须实现Runable接口,在JDK中提供了如下阻塞队列:

  1. ArrayBlockingQueue:基于数组结构的有界阻塞队列,按FIFO排序任务
  2. LinkedBlockingQuene:基于链表结构的阻塞队列,按FIFO排序任务,吞吐量通常要高于ArrayBlockingQuene;
  3. SynchronousQuene:一个不存储元素的阻塞队列,每个插入操作必须等到另一个线程调用移除操作,否则插入操作一直处于阻塞状态,吞吐量通常要高LinkedBlockingQuene;
  4. priorityBlockingQuene:具有优先级的无界阻塞队列;
  • threadFactory 它是ThreadFactory类型的变量,用来创建新线程。默认使用Executors.defaultThreadFactory() 来创建线程。使用默认的ThreadFactory来创建线程时,会使新创建的线程具有相同的NORM_PRIORITY优先级并且是非守护线程,同时也设置了线程的名称。
2.3.6 handler

线程池的饱和策略,当阻塞队列满了,且没有空闲的工作线程,如果继续提交任务,必须采取一种策略处理该任务,线程池提供了4种策略:

  1. AbortPolicy:直接抛出异常,默认策略
  2. CallerRunsPolicy:用调用者所在的线程来执行任务
  3. DiscardOldestPolicy:丢弃阻塞队列中靠最前的任务,并执行当前任务
  4. DiscardPolicy:直接丢弃任务

上面的4种策略都是ThreadPoolExecutor的内部类。当然也可以根据应用场景实现RejectedExecutionHandler接口,自定义饱和策略,如记录日志或持久化存储不能处理的任务。

3. 线程池配置

要想合理地配置线程池,就必须首先分析任务特性

  1. 任务的性质:CPU密集型任务、IO密集型任务和混合型任务。
  2. 任务的优先级:高、中和低。
  3. 任务的执行时间:长、中和短。
  4. 任务的依赖性:是否依赖其他系统资源,如数据库连接。

4. 线程池监控

如果在系统中大量使用线程池,则有必要对线程池进行监控,方便在出现问题时,可以根据线程池的使用状况快速定位问题。可以通过线程池提供的参数进行监控,在监控线程池的时候可以使用以下属性。

image.png

  1. taskCount:线程池需要执行的任务数量。
  2. completedTaskCount:线程池在运行过程中已完成的任务数量,小于或等于taskCount。
  3. largestPoolSize:线程池里曾经创建过的最大线程数量。通过这个数据可以知道线程池是否曾经满过。
  4. getPoolSize:线程池的线程数量。如果线程池不销毁的话,线程池里的线程不会自动销毁,所以这个大小只增不减。
  5. ·getActiveCount:获取活动的线程数。

最后

线程池的内容比较多,可能需要拆分多个系列去做介绍,本文主要介绍了线程池的原理, 一些核心参数,方法和整体的框架, 下面会从源码和实际业务场景去分析线程池.

参考文档

Java线程池实现原理及其在美团业务中的实践
《Java并发编程的艺术》