Java并发编程- 并发编程Bug的源头:可见性、原子性和有序性问题

420 阅读4分钟

一、并发编程幕后的故事

硬件设备发展的核心矛盾:CPU、内存、I/O设备三者间存在的速度差异。随着多核时代的到来,为了充分利用 CPU,引入了缓存、CPU 时间片、编译优化等机制,同时也带来了线程安全问题。

越靠近CPU访问速度越快,同时容量也越小。

  • 性能从高到低:CPU>Cache(L1-L2-L3)>内存>SSD硬盘>网卡>机械硬盘
  • 容量从低到高:CPU>Cache(L1-L2-L3)>内存>硬盘

二、并发编程问题的源头

CPU执行往往需要访问内存,有些还需要访问硬盘,根据木桶理论,程序整体的性能取决于最慢的操作——读写I/O设备,即单方面提高CPU性能是无效的。为了合理利用CPU的高性能,平衡三者的速度差异,计算机体系结构、操作系统、编译程序都做出了贡献,主要体现为:

  • CPU增加缓存,以均衡和内存的速度差异,但缓存也带来了可见性问题;
  • 操作系统增加了进程、线程,以分时复用CPU,进而均衡CPU与I/O设备的速度差异,但线程切换带来了原子性问题;
  • 编译程序优化指令执行顺序,使得缓存能够得到更加合理地利用,但编译优化带来了有序性问题。

1.缓存导致的可见性问题

一个线程对共享变量的修改,另一个线程可以立即看到,称之为可见性。CPU缓存导致了内存可见性问题,在Java中,使用volatile关键字解决可见性问题

  • 单核时代,所有线程在同一CPU上,CPU缓存与内存的数据一致性容易解决;
  • 多核时代,每个CPU都有各自的缓存,当多个线程在不同的CPU上执行时,这些线程操作的是不同的CPU缓存。

2.线程切换带来的原子性问题

一个或者多个操作在CPU执行的过程中不被中断的特性,我们称为原子性。CPU能保证的原子操作是CPU指令级别的,而不是高级语言的操作符。线程切换导致了原子性问题,在 Java中,提供了synchronized关键字解决原子性问题。

**进程是操作系统资源分配的基本单位,而线程是处理器任务调度和执行的基本单位。**早期的操作系统基于进程来调度CPU,不同进程间是不共享内存空间的,所以进程要做任务切换就要切换内存映射地址,而一个进程创建的所有线程,是共享一个内存空间的,所以线程做任务切换成本很低。现代的操作系统都基于更轻量的线程来调度,现在的“任务切换”都是指“线程切换”。

Java并发程序都是基于多线程的,线程切换的时机大多数是在CPU时间片结束时。我们现在基本都使用高级语言编程,高级语言里一条语句往往需要多条 CPU 指令完成,CPU能保证的是原子操作是指令级别的,如 count++,至少需要三条 CPU 指令,所以这个操作不是原子操作。

  • 指令 1:把变量count从内存加载到CPU的、寄存器;
  • 指令 2:在寄存器中执行 +1 操作;
  • 指令 3:将结果写入内存(缓存机制导致可能写入的是CPU缓存而不是内存)。

3.编译优化导致有序性问题

编译器为了优化性能,有时候会改变程序中语句的先后顺序。在Java中,提供了happens-before原则来解决有序性问题。

4.总结

其实缓存、线程、编译优化的目的和我们写并发程序的目的是相同的,都是提高程序性能。但是技术在解决一个问题的同时,必然会带来另外一个问题,所以在采用一项技术的同时,一定要清楚它带来的问题是什么,以及如何规避。