走进并行世界

354 阅读6分钟

同步和异步通常用来形容一次方法调用,同步方法调用一旦开始,调用者必须等到调用方法返回后,才能继续后续的行为。

异步方法调用更像一个消息传递,一旦开始,方法调用就会立即返回,调用者就可以继续后续的操作。而异步方法通常会在另一个线程中“真实”的执行。整个过程,不会阻碍调用者的工作。

并发并行,他们都有可以表示两个或者多个任务一起执行,但是侧重点不同,并发是真正意义上的“同时执行”。从严格意义上来说,并行的多个任务是真的同时执行,而对于并发来说,这个过程只是交替的,一会执行任务A,一会执行任务B,系统会不停的在两者之间切换,但对于外部观察者来说,技师多过任务之间是串行并发的,也会造成多任务间并行执行的错觉。

实际上,如果系统内只有一个cpu,而使用多进程或者多线程任务,那么真实环境中,这些任务不可能真的真实并行,毕竟一个cpu一次只能执行一条指令,在这种情况下多进程或者多线程就是并发的,而不是并行的(操作系统会不停的切换多个任务)。真实的并行只可能出现在拥有多个cpu的系统中。

临界区: 临界区用来表示一种公共资源或者说共享数据,可以被多个线程使用。但是每一次,只能有一个线程使用它,一旦临界区资源被占用,其他线程要想使用这个资源就必须等待。

阻塞和非阻塞: 阻塞和非阻塞通常用来形容多个线程间的相互影响。比如一个线程占用了临界区资源,那么其他所有需要这个资源的线程就必须在这个临界区中等待。等待会导致线程挂起,这种情况就是阻塞。此时,如果占用资源的线程一直不愿意释放资源,那么其他所有咋舌在这个临界区上的线程都不能工作。

非阻塞的意思与之相反,它强调没有一个线程可以妨碍其他线程执行,所有线程都会尝试不断的前向执行。

死锁、饥饿和活锁: 饥饿:指某一个或者多个线程因为种种原因无法获得所需要的资源,导致一直无法执行。比如它的线程优先级可能太低,而高级优先级线程不断抢占它需要的资源,导致低优先级线程无法工作。 此外,某一线程一直占着关键资源不放,导致其他需要的这个资源的线程无法正常执行,这种情况也是饥饿的一种。

活锁:如果两个线程都有秉承着谦让的原则,主动将资源释放给他人使用,那么就会导致资源不断的在两个线程间跳动,而没有一个线程可以同时拿到所有资源正常执行。

并发级别: 由于临界区的存在,多线程之间的并发必须受到控制。根据控制并发的策略,我们可以把并发的级别分为:阻塞、无饥饿、无障碍、无锁、无等待几种。

阻塞: 一个线程是阻塞的,那么在其他线程释放资源之前,当前线程无法继续执行。synchronize关键字和重入锁都在试图执行后续代码前,得到临界区的锁,如果得不到,线程就会被挂起等待,直到占有了所需资源为止。

无饥饿: 如果线程之前有优先级,那么线程调度的时候总是会倾向于先满足高优先级的线程。对于非公平锁来说,系统允许高级优先级的线程插队。这样有可能导致低优先级线程产生饥饿。但是如果锁是公平的,按照先来后到的规则,那么饥饿就不会产生,不管新来的线程优先级多高,要想获得资源,就必须乖乖排队,这样所有的线程都会有机会执行。

无障碍: 五张带是一种最弱的非阻塞调度。两个线程如果无障碍的执行,那么不会因为临界区的问题导致一方被挂起。换言之,大家都可以大摇大摆的进入临界区。那么大家一起修改共享数据,把数据改坏了怎么办?对于无障碍的线程来说,一旦检测到这种情况,它就会立即对自己所做的修改进行回滚,确保数据安全,但如果没有数据竞争发生,那么线程就可以顺利完成自己的工作,走出临界区。 如果说阻塞的控制方式的悲观策略,也就是说,系统任务两个线程之间很有可能发生不幸的冲突,因此以保护共享数据为第一优先级,相对来说,非阻塞的调度就是一种乐观的策略。一种可行的无障碍实现跨越依赖一个“一致性标记”来实现。线程在操作之前,先读取并保存这个标记,在操作完成后,再次读取,检查这个标记是否被更改过,如果两者一致,则说明资源访问没有冲突。如果不一致,则说明资源可能在操作过程中与其他写线程冲突,需要重试操作。而任何对资源有修改操作的线程,在修改数据前,都需要更新这个一致性标记,表示数据不再安全。

无锁: 无锁的并行都是无障碍的,在无锁的情况下,所有的线程都能尝试对临界区进行访问,但不同的是,无锁的并发保证必然有一个线程能够在有限步内完成操作离开临界区。

无等待: 它要求所有的线程都必须在有限步内完成。

指令重排: 哪些指令不能重排:Happen-Before规则:

程序顺序原则:一个线程内保证语义的串行性。

volatile规则:volatile变量的写先与读发生,这保证了volatile变量的可见性。

锁规则:解锁(unlock)必然发生在随后的加锁(lock)前。

传递性:A先于B,B先于C,那么A必然先于C。

线程的start()方法先于它的每一个动作。

线程的所有操作先于线程的终结(Thread.join())。

线程的中断(interrupt())先于被中断线程的代码。

对象的构造函数的执行、结束先于finalize()方法。