面试官: 说一下线程池内部工作原理

213 阅读6分钟

如果并发的线程数量很多,并且每个线程都是执行一个时间很短的任务就结束了,这样频繁创建线程就会大大降低系统的效率,因为频繁创建线程和销毁线程需要时间。

那么有没有一种办法使得线程可以复用,就是执行完一个任务,并不被销毁,而是可以继续执行其他的任务? 在Java中可以通过线程池来达到这样的效果。今天我们就来详细讲解一下Java的线程池,

首先我们从最核心的ThreadPoolExecutor类中的方法讲起,然后再讲述它的实现原理,接着给出了它的使用示例,最后讨论了一下如何合理配置线程池的大小。

1.线程池的创建 java.uitl.concurrent.ThreadPoolExecutor 类是线程池中最核心的一个类,通过查看源码,我们可以知道这个类继承了AbstractExecutorService 抽象类. 下面我们来看一下ThreadPoolExecutor类中的构造方法:

  • ThreadPoolExecutor类中共有4个构造方法, 前三个构造方法其实最终调用的都是最后一个构造方法,也就是下面这个参数最全的构造方法.
  • 构造方法

image.png

接下来我们来看一下这个构造器中,每个参数的含义分别是什么:

  • corePoolSize

    • 核心池的大小,这个参数跟后面讲述的线程池的实现原理有非常大的关系。在创建了线程池后,默认情况下,线程池中并没有任何线程,而是等待有任务到来才创建线程去执行任务,除非调用了prestartAllCoreThreads()或者prestartCoreThread()方法,从这2个方法的名字就可以看出,是预创建线程的意思,即在没有任务到来之前就创建corePoolSize个线程或者一个线程。默认情况下,在创建了线程池后,线程池中的线程数为0,当有任务来之后,就会创建一个线程去执行任务,当线程池中的线程数目达到corePoolSize后,就会把到达的任务放到缓存队列当中;
  • maximumPoolSize

    • 线程池中最大线程数,用来表示线程池中最多能创建多少个线程.
  • keepAliveTime

    • 线程的存活时间,表示线程没有任务执行时最多保持多久时间会终止。
    • 默认情况下,只有当线程池中的线程数大于corePoolSize时,keepAliveTime才会起作用,直到线程池中的线程数不大于corePoolSize,即当线程池中的线程数大于corePoolSize时,如果一个线程空闲的时间达到keepAliveTime,则会终止,直到线程池中的线程数不超过corePoolSize。但是如果调用了allowCoreThreadTimeOut(boolean)方法,在线程池中的线程数不大于corePoolSize时,keepAliveTime参数也会起作用,直到线程池中的线程数为0;
  • unit

    • 参数keepAliveTime的时间单位,有7种取值,在TimeUnit类中有7种静态属性:
      • TimeUnit.DAYS; //天
      • TimeUnit.HOURS; //小时
      • TimeUnit.MINUTES; //分钟
      • TimeUnit.SECONDS; //秒
      • TimeUnit.MILLISECONDS; //毫秒
      • TimeUnit.MICROSECONDS; //微妙
      • TimeUnit.NANOSECONDS; //纳秒
  • workQueue

    • 一个阻塞队列,用来存储等待执行的任务,这个参数的选择也很重要,会对线程池的运行过程产生重大影响,一般来说,这里的阻塞队列有以下几种选择:
      • ArrayBlockingQueue;
      • LinkedBlockingQueue;
      • SynchronousQueue;
  • threadFactory

    • 线程工厂,用来创建线程,主要是为了给线程起名字,默认工厂的线程名字 pool-1-thread-3。
  • Handler

    • 拒绝策略,当线程池里线程被耗尽,且队列也满了的时候会调用。
      • ThreadPoolExecutor.AbortPolicy:丢弃任务并抛出RejectedExecutionException异常。
      • ThreadPoolExecutor.DiscardPolicy:也是丢弃任务,但是不抛出异常。
      • ThreadPoolExecutor.DiscardOldestPolicy:丢弃队列最前面的任务,然后重新尝试执行任务(重复此过程)
      • ThreadPoolExecutor.CallerRunsPolicy:由调用线程处理该任务

以上就是创建线程池时用到的几个参数,面试中经常会有面试官问到这些参数的含义. 2.线程池的工作流程 下图为线程池的执行流程

image.png

  1. 如果当前工作线程数小于核心线程,则创建核心线程执行任务。
  2. 如果当前线程大于核心线程数则判断等待队列是否已满,如果没有满则添加任务到等待队列中去,如果工作线程数量为0则创建非核心线程,并从等待队列中拉取任务执行。
  3. 最后如果队列已满创建一个非核心线程执行任务。如果创建失败则会拒绝任务。

3.源码执行流程分析 ThreadPoolExecutor是线程池的实现类,无论是自定义线程池,还是使用系统提供的线程池,都会使用到这个类.通过类的execute(Runnable command)方法来执行Runnable任务. 1.所以我们首先来看execute方法

image.png

  1. 判断当前活跃线程数是否小于corePoolSize,如果小于,则调用addWorker创建线程执行任务
  2. 如果不小于corePoolSize,则将任务添加到workQueue队列。
  3. 如果放入workQueue失败,则创建线程执行任务,如果这时创建线程失败(当前线程数不小于maximumPoolSize时),就会调用reject(内部调用handler)拒绝接受任务。

2.再看下addWorker的方法实现 在execute()方法中获知通过addWorker()方法来添加新线程,那么到底是如何添加和管理的? 这块代码是在创建非核心线程时,即core等于false。判断当前线程数是否大于等于maximumPoolSize,如果大于等于则返回false,即上边说到的 3中创建线程失败的情况。

image.png 创建worker对象,并将Runnable作为参数传递进去,并从worker中取出Thread对象,进行一系列条件判断后. 开启Thread的start()方法,线程开始运行.所以worker对象中必然包含了一个Thread和一个要被执行的Runnable. 3.再到Worker里看看其实现

image.png

  • 每个worker,都是一条线程,同时里面包含了一个firstTask,即初始化时要被首先执行的任务.
  • 最终执行任务的,是runWorker()方法 4.接下来咱们看看runWorker方法的逻辑

image.png

线程调用runWoker,会while循环调用getTask方法从workerQueue里读取任务,然后执行任务。只要getTask方法不返回null,此线程就不会退出。 5.最后在看看getTask方法实现

image.png

  • 先不管allowCoreThreadTimeOut,这个变量默认值是false。wc>corePoolSize则是判断当前线程数是否大于corePoolSize。
  • 如果当前线程数大于corePoolSize,则会调用workQueue的poll方法获取任务,超时时间是keepAliveTime。如果超过keepAliveTime时长,poll返回了null,上边提到的while循序就会退出,线程也就执行完了。

最近收集整理一份面试资料,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等技术点,有兴趣的同学可以+VX: babadeerya520 获取相关资料.