一、什么是线程池?
线程池做的工作主要是控制运行的线程的数量,处理过程中将任务加入队列,然后在线程创建后启动这些任务,如果线程数超过了最大数量,超出的数量的线程排队等候,等其他线程执行完毕,再从队列中取出任务来执行。
线程池的主要特点为:线程复用、控制最大并发数、管理线程。
二、线程池的优势
- 降低资源消耗。 通过重复利用自己创建的线程,降低线程创建和销毁造成的消耗。
- 提高响应速度。 当任务到达时,任务可以不需要等到线程创建就能立即执行。
- 提高线程的可管理性。 线程是稀缺资源,如果无限的创建,不仅会消耗资源,还会较低系统的稳定性,使用线程池可以进行统一分配,调优和监控。
三、架构实现
Java 中的线程池是通过Executor框架实现的,该框架中用到了Executor,Executors,ExecutorService,ThreadPoolExecutor这几个类。
四、线程池的几种创建方式
4.0 ThreadPoolExecutor()
最原始的线程池创建,下面的前三种创建方式都是对ThreadPoolExecutor的封装。
4.1 Executors.newFixedThreadPool(int)
主要特点如下:
- 创建一个定长线程池,可控制线程的最大并发数,超出的线程会在队列中等待.
newFixedThreadPool创建的线程池corePoolSize和MaxmumPoolSize是相等的,它使用的LinkedBlockingQueue。
4.2 Executors.newSingleThreadExecutor()
主要特点如下:
- 创建一个单线程化的线程池,它只会用唯一的工作线程来执行任务,保证所有任务都按照指定顺序执行。
newSingleThreadExecutor将corePoolSize和MaxmumPoolSize都设置为1,它使用的是LinkedBlockingQueue。
4.3 Executors.newCachedThreadPool()
主要特点如下:
- 创建一个可缓存线程池,如果线程池长度超过处理需要,可灵活回收空闲线程;若无可回收,则创建新线程。
newCachedThreadPool将corePoolSize设置为 0,MaxmumPoolSize设置为Integer.MAX_VALUE,它使用的是SynchronousQueue,也就是说来了任务就创建线程运行,如果线程空闲超过60秒,就销毁线程。
4.4 Executors.newWorkStealingPool()
Java 8 加入的创建方法,其内部会构建ForkJoinPool,利用Work-Stealing算法,并行地处理任务,不保证处理顺序。
4.5 生产中的使用
实际生产中不使用 Executors 创建线程池,需要使用 ThreadPoolExecutor 自定义创建。
阿里巴巴开发手册中关于并发处理的部分内容:
自定义创建线程池:
public static void main(String[] args) {
ExecutorService threadPool = new ThreadPoolExecutor(
2,
5,
1L,
TimeUnit.SECONDS,
new LinkedBlockingQueue<>(3),
Executors.defaultThreadFactory(),
new ThreadPoolExecutor.AbortPolicy());
try {
for (int i = 1; i <= 10; i++) {
threadPool.execute(() -> {
System.out.println(Thread.currentThread().getName() + "\t 办理业务");
});
}
} finally {
threadPool.shutdown();
}
}
五、线程池中的几个重要参数
corePoolSize:线程池中的常驻核心线程数。maximumPoolSize:线程池能够容纳的同时执行的最大线程数,此值大于等于 1。keepAliveTime:多余的空闲线程存活时间,当空闲时间达到keepAliveTime值时,多余的线程会被销毁,直到只剩下corePoolSize个线程为止。unit:keepAliveTime的单位。workQueue:任务队列,被提交但尚未被执行的任务。threadFactory:表示生成线程池中工作线程的线程工厂,用户创建新线程,一般用默认即可。handler:拒绝策略,表示当线程队列满了并且工作线程大于等于线程池的最大线程数(maxnumPoolSize)时如何来拒绝。
六、线程池的底层工作原理
- 在创建了线程池后,等待提交过来的任务请求。
- 当调用
execute()方法添加一个请求任务时,线程池会做如下判断:
2.1 如果正在运行的线程数量小于corePoolSize,那么马上创建线程运行这个任务;
2.2 如果正在运行的线程数量大于或等于corePoolSize,那么将这个任务放入队列;
2.3 如果这时候队列满了且正在运行的线程数量还小于maximumPoolSize,那么还是要创建非核心线程立刻运行这个任务;
2.4 如果队列满了且正在运行的线程数量大于或等于maximumPoolSize,那么线程池会启动饱和拒绝策略来执行。 - 当一个线程完成任务时,它会从队列中取下一个任务来执行。
- 当一个线程无事可做,超过一定的时间(
keepAliveTime) 时,线程池会判断:
如果当前运行的线程数大于corePoolSize,那么这个线程就被停掉。
所以线程池的所有任务完成后,它最终会收缩到corePoolSize的大小。
七、线程池的拒绝策略
当线程池中工作线程数达到maximumPoolSize,且工作队列已满,那么就会执行拒绝策略处理任务,jdk 内置有四种拒绝策略。
| 拒绝策略 | 拒绝行为 |
|---|---|
AbortPolicy | 直接抛出 RejectedException 异常阻止系统正常运行 |
CallerRunsPolicy | "调用者运行"一种调节机制,该策略既不会抛弃任务,也不会抛出异常,而是由提交任务者执行这个任务 |
DiscardOldestPolicy | 抛弃队列中等待最久的任务,然后把当前任务加入队列中尝试再次提交 |
DiscardPolicy | 直接丢弃任务,不予任何处理也不抛出异常。如果允许任务丢失,这是最好的拒绝策略 |
八、合理配置线程池参数
首先,通过System.out.println(Runtime.getRuntime().availableProcessors());获得当前计算机的 CPU 核数。
8.1 CPU 密集型
CPU 密集的意思是该任务需要大量的运算,而没有阻塞,CPU一直全速运行。
CPU 密集任务只有在真正的多核 CPU 上才可能得到加速(通过多线程),而在单核CPU上,无论开几个模拟的多线程,该任务都不可能得到加速,因为CPU总的运算能力就那些。
CPU 密集型任务配置尽可能少的线程数量:一般公式:CPU核数+1个线程的线程池
8.2 IO密集型
- 由于 IO 密集型任务线程并不是一直在执行任务,则应配置尽可能多的线程,如 CPU 核数 * 2。
- IO密集型,即该任务需要大量的IO,即大量的阻塞。在单线程上运行 IO 密集型的任务会导致浪费大量的 CPU 运算能力在等待上。所以在 IO 密集型任务中使用多线程可以大大的加速程序运行,即使在单核CPU上,这种加速主要就是利用了被浪费掉的阻塞时间。
IO 密集型时,大部分线程都阻塞,故需要多配置线程数:
参考公式:CPU核数 / (1-阻塞系数) 阻塞系数在0.8~0.9之间
比如 8 核CPU:8 / (1 - 0.9) = 80 个线程数