什么是 CAS
- CAS,compare and swap的縮寫,中文翻譯成比較并交換。CAS指令在Intel CPU上稱為CMPXCHG指令,它的作用是將指定內存地址的內容與所給的某個值相比,如果相等,則將其內容替換為指令中提供的新值,如果不相等,則更新失敗。
- 從內存領域來說這是樂觀鎖,因為它在對共享變量更新之前會先比較當前值是否與更新前的值一致,如果是,則更新,如果不是,則無限循環執行(稱為自旋),直到當前值與更新前的值一致為止,才執行更新。
- CAS 有 3 個操作數,內存值 V,舊的預期值 A,要修改的新值 B。當且僅當預期值 A 和內存值 V 相同時,將內存值 V 修改為 B,否則什么都不做。
那些地方采用了 CAS 機制?
- 在
java.util.concurrent.atomic
包下,一系列以Atomic
開頭的包裝類。例如AtomicBoolean
,AtomicInteger
,AtomicLong
等,它們就是典型的利用 CAS 機制實現的原子操作類。 - 此外,
Lock
系列類的底層實現以及 Java 1.6 在synchronized
轉換為重量級鎖之前,也會采用到 CAS 機制。
CAS底層實現
簡單分析一下AtomicInteger的incrementAndGet的實現。
public final int incrementAndGet() {
for (;;) {
int current = get();
int next = current + 1;
if (compareAndSet(current, next))
return next;
}
}
private volatile int value;
public final int get() {
return value;
}
這段代碼是一個無限循環,也就是CAS的自旋。循環體當中做了三件事:
- 獲取當前值。
- 當前值+1,計算出目標值。
- 進行CAS操作,如果成功則跳出循環(當前值和目標值相等),如果失敗則重復上述步驟。
注意:
- 這里需要注意的重點是 get 方法,這個方法的作用是獲取變量的當前值。
- 如何保證獲得的當前值是內存中的最新值呢?很簡單,用volatile關鍵字來保證。
拓展一下:while(1) 和 for(;;)兩種死循環:
while(1) :
編譯前 編譯后
while (1); mov eax,1
test eax,eax
je foo+23h
jmp foo+18h
for(;;):
編譯前 編譯后
for (;;); jmp foo+23h
總結:宏觀功能相同的,但是底層編譯后代碼簡潔很多。
那么compareAndSet方法如何保證原子性操作呢?
public final boolean compareAndSet(int expect, int update) {
return unsafe.compareAndSwapInt( this, valueOffset, expect, update);
}
compareAndSet方法的實現很簡單,只有一行代碼。這里涉及到兩個重要的對象,一個是unsafe,一個是valueOffset。
- 什么是unsafe呢?Java語言不像C,C++那樣可以直接訪問底層操作系統,但是JVM為我們提供了一個后門,這個后門就是unsafe。unsafe為我們提供了硬件級別的原子操作。
- 至于valueOffset對象,是通過unsafe.objectFieldOffset方法得到,所代表的是AtomicInteger對象value成員變量在內存中的偏移量。我們可以簡單地把valueOffset理解為value變量的內存地址。
總結:關鍵在于unsafe提供硬件級別的原子操作。
CAS機制當中使用了3個基本操作數:內存地址V,舊的預期值A,要修改的新值B。而unsafe的compareAndSwapInt方法參數包括了這三個基本元素:valueOffset參數代表了V,expect參數代表了A,update參數代表了B。正是unsafe的compareAndSwapInt方法保證了Compare和Swap操作之間的原子性操作。
CAS 的缺點及解決方式
CAS雖然很高效的解決原子操作,但是CAS仍然存在三大問題。ABA問題,循環時間長開銷大和只能保證一個共享變量的原子操作:
-
ABA問題:因為CAS需要在操作值的時候檢查下值有沒有發生變化,如果沒有發生變化則更新,但是如果一個值原來是A,變成了B,又變成了A, 那么使用CAS進行檢查時會發現它的值沒有發生變化,但是實際上卻變化了。
- ABA問題的解決思路就是使用版本號。在變量前面追加上版本號,每次變量更新的時候把版本號加一,那么A-B-A 就會變成1A-2B-3A。
- 從Java1.5開始JDK的atomic包里提供了一個類 AtomicStampedReference 來解決ABA問題。這個類的compareAndSet方法作用是首先檢查當前引用是否等于預期引用,并且當前標志是否等于預期標志,如果全部相等,則以原子方式將該引用和該標志的值設置為給定的更新值。
-
循環時間長開銷大:在并發量比較高的情況下,如果許多線程反復嘗試更新某一個變量,即自旋CAS如果長時間不成功,會給CPU帶來非常大的執行開銷。
- 如果JVM能支持處理器提供的pause指令,那么效率會有一定的提升。pause指令有兩個作用,第一它可以延遲流水線執行指令(de-pipeline),使CPU不會消耗過多的執行資源,延遲的時間取決于具體實現的版本,在一些處理器上延遲時間是零。第二它可以避免在退出循環的時候因內存順序沖突(memory order violation)而引起CPU流水線被清空(CPU pipeline flush),從而提高CPU的執行效率。
- 代碼層面,破壞掉for死循環,當自旋超過一定時間或者一定次數時,return退出。
- 使用類似ConcurrentHashMap的方法。當多個線程競爭時,將粒度變小,將一個變量拆分為多個變量,達到多個線程訪問多個資源的效果,最后再調用sum把它合起來,能降低CPU消耗,但是治標不治本。
-
只能保證一個共享變量的原子操作:當對一個共享變量執行操作時,我們可以使用循環CAS的方式來保證原子操作,但是對多個共享變量操作時,循環CAS就無法保證操作的原子性。
- 這個時候就可以用鎖,或者有一個取巧的辦法,就是把多個共享變量合并成一個共享變量來操作。比如有兩個共享變量i=2,j=a,合并一下ij=2a,然后用CAS來操作ij。
- 從Java1.5開始JDK提供了AtomicReference類來保證引用對象之間的原子性,你可以把多個變量放在一個對象里來進行CAS操作。
synchronized 和 CAS 的區別
-
synchronized
采用的是 CPU 悲觀鎖機制,即線程獲得的是獨占鎖。獨占鎖就意味著 其他線程只能依靠阻塞來等待線程釋放鎖。而在 CPU 轉換線程阻塞時會引起線程上下文切換,當有很多線程競爭鎖的時候,會引起 CPU 頻繁的上下文切換導致效率很低。盡管 Java1.6 為synchronized
做了優化,增加了從偏向鎖到輕量級鎖再到重量級鎖的過度,但是在最終轉變為重量級鎖之后,性能仍然較低。 - CAS 是英文單詞 Compare And Swap 的縮寫,翻譯過來就是比較并替換。它當中使用了3個基本操作數:內存地址 V,舊的預期值 A,要修改的新值 B。采用的是一種樂觀鎖的機制,它不會阻塞任何線程,所以在效率上,它會比
synchronized
要高。所謂樂觀鎖就是:每次不加鎖而是假設沒有沖突而去完成某項操作,如果因為沖突失敗就重試,直到成功為止。
所以,在并發量非常高的情況下,我們盡量的用同步鎖,而在其他情況下,我們可以靈活的采用 CAS 機制。
巨人的肩膀:
http://www.lxweimin.com/p/335b0c273345
https://mp.weixin.qq.com/s/nRnQKhiSUrDKu3mz3vItWg
http://www.lxweimin.com/p/12192b13990f