学习过多线程的同学一定看到过 CAS
这个概念,CAS
是 Compare-and-swap
的简称,那它有什么作用呢 ?为什么能够代替 synchorinzed
?
CAS
CAS(Compare-and-swap)
:比较和替换,它是设计并发算法是的一种常用技术。使用 CAS
操作可用于保证变量更新的原子性。
CAS
操作涉及到 3
个值:
V
当前值:变量当前在内存中的值A
期望值:期望变量当前在内存中的值B
更新值:准备为变量赋予的新值
CAS
操作逻辑如下:CAS
比较 V
和 A
的值,如果值相等则变量值更新为 B
,否则不进行任何操作。如下图:
如果第一次接触到 CAS
的概念可能对它的操作逻辑产生疑惑,为什么在相等的情况下执行赋值操作而不等的情况下反而什么都不做呢?下面看一个自增操作的示例:
/**
* Atomically increments by one the current value.
*
* @return the updated value
*/
public final int incrementAndGet() {
for (;;) {
//获取当前值, 此示例中当前值也是本次 `CAS` 的期望值
int current = get();
//获取更新值
int next = current + 1;
//执行CAS操作
if (compareAndSet(current, next)) {
//成功后才会返回期望值,否则无线循环
return next;
}
}
}
现在有线程 A、B
,当线程 A
执行到 CAS
操作, 获取当前值、期望值和更新值分别为 0、0、1
, 此时线程 A
被挂起,线程 B
进入执行 CAS
操作将变量值成功更新为 1
, 线程 A
继续执行 CAS
操作, 由于此时变量当前值已经被修改,所以本次 CAS
执行失败,循环继续执行 CAS
自增操作,执行成功退出循环。
CAS VS synchorinzed
通过上面的示例知道 CAS
可以保证变量更新的原子性,进而可以联想到 volatile
关键字的功能缺陷。
先来看 volatile
关键字的作用,如下:
- 有序性:防止重排序;
- 可见性:变量更新时所有线程都可以访问到变量的最新值;
- 原子性:只能保证单次读、写操作的原子性。
volatile
关键字的缺陷正是其无法保证变量操作的原子性,比如单目运算符 ++、--
就涉及到读写两个操作。所以经常可以看到 volatile
和 synchorinzed
关键字共用的场景以保证变量操作的原子性,而 CAS
也可以保证变量操作的原子性。那 CAS
是否可以替代 synchorinzed
呢?在某些情况下是可以的。
比如在上面的示例中,AtomicInteger().getAndIncrement()
的内部源码如下:
/**
* Atomically increments by one the current value.
*
* @return the previous value
*/
public final int getAndIncrement() {
return U.getAndAddInt(this, VALUE, 1);
}
public final int getAndAddInt(Object var1, long var2, int var4) {
int var5;
do {
var5 = this.getIntVolatile(var1, var2);
} while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));
return var5;
}
可以看到这里就是通过 volatile + CAS
的操作来保证变量操作安全性的。
那下面对 CAS
和 synchorinzed
的使用做下对比,主要从如下两方面:
功能限制:
CAS
更加轻量级,synchorinzed
升级为重量锁时会影响系统性能;CAS
仅能保证单个变量操作的原子性,synchorinzed
可以保证代码块内所有变量操作的原子性。
并发规模:
- 低并发:
CAS
更具优势,synchorinzed
在少量情况下仍可能升级为重量锁影响系统性能。 - 高并发:
synchorinzed
更具优势,由于CAS
的很多实现都会使用了自旋操作(如下文将介绍的Atomic***
系列),当在大量线程的情况下CAS
会频繁执行失败进而需要频繁重试,这样会浪费CPU
资源。
结论:
在少量线程且仅需保证单个变量线程安全的情况下可使用 volatile + CAS
替代 synchorinzed
。
注意:
volatile + CAS
和synchorinzed
使用时要理解它们各自的角色和起到的作用:
synchorinzed
:可见性、有序性和原子性;volatile
:保证有序性和可见性;CAS
:保证操作原子性;
注意:多线程环境下正确使用
CAS
必须搭配volatile
关键字。因为CAS
虽然可以保证原子性,但其无法保证变量在不同线程内存空间的安全性,所以需要volatile
来保证变量更新对于不同线程是可见的。
ABA 问题
除了上文提到过 CAS
的两个缺点:
- 仅能保证单个变量操作的原子性;
- 在高并发情况下
CAS
一直失败会一直重试,浪费CPU
资源针。对这个问题的一个思路是引入退出机制,如重试次数超过一定阈值后失败退出。当然,更重要的是避免在高并发环境下使用CAS
。
还有一个问题就是 ABA
问题,现有线程 A、B
:
- 线程
1
读取内存中的数据为A
; - 线程
2
修改内存数据为B
; - 线程
2
修改内存数据为A
; - 线程
1
对数据执行CAS
操作。
由于执行到第四步时内存数据仍然为 A
,但其实数据已经被修改过了。这就是 ABA
问题。针对 ABA
问题可以通过引入版本号的方式解决,每次修改内存中的值版本号都 +1
,在执行 CAS
操作是不仅比较内存中的值也比较版本号,只有两者都相同时才执行成功。Java
中提供的 java.util.concurrent.atomic.AtomicStampedReference
也是通过版本号来解决 ABA
问题的。
在 Android 中的使用
在 Android
中我们也可以通过 Atomic***
类来使用 volatile + CAS
。
AtomicFile
AtomicInteger
AtomicLong
AtomicBoolean
AtomicReferenceFieldUpdater
AtomicStampedReference
前几个比较好理解,分别可以保证 file、int、long、boolean
类型数据的原子操作,那么如果操作数据为 String
或类型不可知怎么办呢?这时候就可以使用 AtomicReferenceFieldUpdater()
了。在 Kotlin.lazy
的实现中就使用到了 AtomicReferenceFieldUpdater
:
private class SafePublicationLazyImpl<out T>(initializer: () -> T) : Lazy<T>, Serializable {
@Volatile private var initializer: (() -> T)? = initializer
@Volatile private var _value: Any? = UNINITIALIZED_VALUE
// this final field is required to enable safe initialization of the constructed instance
private val final: Any = UNINITIALIZED_VALUE
override val value: T
get() {
val value = _value
if (value !== UNINITIALIZED_VALUE) {
@Suppress("UNCHECKED_CAST")
return value as T
}
val initializerValue = initializer
// if we see null in initializer here, it means that the value is already set by another thread
if (initializerValue != null) {
val newValue = initializerValue()
if (valueUpdater.compareAndSet(this, UNINITIALIZED_VALUE, newValue)) {
initializer = null
return newValue
}
}
@Suppress("UNCHECKED_CAST")
return _value as T
}
......
companion object {
private val valueUpdater = java.util.concurrent.atomic.AtomicReferenceFieldUpdater.newUpdater(
SafePublicationLazyImpl::class.java,
Any::class.java,
"_value"
)
}
}
AtomicReferenceFieldUpdater
通过静态方法 newUpdater()
获取实例对象。newUpdater()
方法有三个参数,分别是:
tclass
:目标变量所在类的class
对象;vclass
:目标变量的类型class
对象;fieldName
:目标变量名。
在上述 kotlin.lazy
源码中通过比较初始值,保证在多线程环境中仅第一次赋值有效:
valueUpdater.compareAndSet(this, UNINITIALIZED_VALUE, newValue)
再来看 AtomicStampedReference
,它的初始化方法如下:
public AtomicStampedReference(V initialRef, int initialStamp) {
}
可以看到初始化方法需要两个参数:
- 初始值
- 暂且看做初始版本号
用法如下:
private val atomicObj: AtomicStampedReference<String> = AtomicStampedReference("A", 0)
val t1 = Thread {
try {
TimeUnit.SECONDS.sleep(1)
} catch (e: InterruptedException) {
}
println("run thread1")
atomicObj.compareAndSet("A", "B", atomicObj.stamp, atomicObj.stamp + 1)
atomicObj.compareAndSet("B", "A", atomicObj.stamp, atomicObj.stamp + 1)
}
val t2 = Thread {
val stamp: Int = atomicObj.stamp
try {
TimeUnit.SECONDS.sleep(2)
} catch (e: InterruptedException) {
}
println("run thread2")
val result: Boolean = atomicObj.compareAndSet("A", "B", stamp, stamp + 1)
println(result) // false
}
t1.start()
t2.start()
可以看到由于 Thread2
提前获取了版本号,及时 Thread1
执行之后值依然是 A
, 但由于版本号已然发生了变化所以 Thread2
的执行结果仍然是 false
。