JUC - 多线程之ForkJoin

ForkJoin

ForkJoin是在Java7提供的一个用于并行执行任务的框架，ForkJoin从字面意思上看Fork是分叉的意思，Join是结合的意思，核心思想就是把大任务分割成若干个小任务，最终汇总每个小任务结果后得到大任务结果，其实现思想与MapReduce差不多。

ForkJoin体系中最为关键的就是ForkJoinTask和ForkJoinPool，ForkJoin就是利用分治的思想将大的任务按照一定规则Fork拆分成小任务，再通过Join聚合起来；

ForkJoin最经典的一个应用就是Java8中的Stream，我们知道Stream分为串行流和并行流，其中并行流parallelStream就是依赖于ForkJoin来实现并行处理的；

ForkJoinTask : 基本任务，使用fork、join框架必须创建的对象，提供fork,join操作，常用的三个子类如下：

ForkJoinTask提供了两个重要的方法：

（1）fork：让task异步执行，类似于线程的Thread.start()方法，但是它不是真的启动一个线程，而是将任务放入到工作队列中。

（2）join：让task同步执行，可以获取返回值，类似于线程的Thread.join()方法，但是他不是简单的阻塞线程，而是利用工作线程运行其他任务，当一个工作线程调用了join()方法，它将处理其他任务，直到注意到目标子任务已经完成了。

ForkJoinPool:专门用来运行ForkJoinTesk的线程池，在实际使用，也可以接受Runnable/Callable任务，但是在真正运行时，也会把这些任务封装成ForkJoinTesk类型的任务；

这是ForkJoin框架的核心，是ExecutorService的一个实现，用于管理工作线程，并提供一些工具来帮助获取有关线程池状态和性能的信息，工作线程异常只能执行一个任务；

ForkJoinPool并不会为每一个子任务创建一个单独的线程，相反，线程池中的每个线程都有自己的双端队列用于存储任务（double-ended queue）.

这种架构使用了一种名为工作窃取（work-stealing）算法来平衡线程的工作负载。

ForkJoinPool内部使用的是“工作窃取”算法实现的。

最适合的是计算密集型任务；
在需要阻塞工作线程时，可以使用ManagedBlocker；
不应该在RecursiveTask的内部使用ForkJoinPool.invoke()/invokeAll()；
ForkJoinPool特别适合于“分而治之”算法的实现；
ForkJoinPool和ThreadPoolExecutor是互补的，不是谁替代谁的关系，二者适用的场景不同；
ForkJoinTask有两个核心方法——fork()和join()，有三个重要子类——RecursiveAction、RecursiveTask和CountedCompleter；
ForkjoinPool内部基于“工作窃取”算法实现；
每个线程有自己的工作队列，它是一个双端队列，自己从队列头存取任务，其它线程从尾部窃取任务；
RecursiveTask内部可以少调用一次fork()，利用当前线程处理，这是一种技巧；

ManagedBlocker相当于明确告诉ForkJoinPool框架要阻塞了，ForkJoinPool就会启另一个线程来运行任务，以最大化地利用CPU。