volatile是輕量級的synchronized,它在多處理器開發(fā)中保證了共享變量的“可見性”,它比synchronized的使用開銷低因為,他不會引起線程上下文的切換。
1.volatile的定義與實現(xiàn)原理
Java語言提供了volatile,在某些情況下比鎖要更方便。如果一個字段被聲明成volatile,Java線程內(nèi)存模型確保所有線程看到這個變量的值是一致的。
CPU指令:
在X86處理器下通過工具獲取JIT編譯器生成的匯編指令來查看對volatile進行寫操作時,CPU會做什么事情。
代碼:instance = new Singleton();? //instance是volatile變量。
匯編代碼: 0x01a3deld:movb $0X0,0X1104800(%esi);0x01a3de24:lock $0X0,(%esp);
有l(wèi)ock前綴在多核處理器下會引發(fā)兩件事。
1)將該處理器的該緩存行寫回到系統(tǒng)內(nèi)存中。
2)這個寫會內(nèi)存的操作會使其他處理器存儲了該地址數(shù)據(jù)的數(shù)據(jù)無效。
為了提高處理速度,處理器不直接和內(nèi)存進行通信,而是先將系統(tǒng)內(nèi)存的數(shù)據(jù)讀到內(nèi)部緩存(L1,L2或其他)后再進行操作,JVM就會向處理器發(fā)送一條Lock前綴的指令,將這個變量所在緩存行的數(shù)據(jù)寫回到系統(tǒng)內(nèi)存。但是,就算寫會到內(nèi)存,如果其他處理器緩存的值還是舊的,再執(zhí)行計算操作就會有問題。所以,在多處理器下,為了保證各個處理器的緩存是一致的,就會實現(xiàn)緩存一致性協(xié)議,每個處理器通過嗅探在總線上傳播的數(shù)據(jù)來檢查自己的緩存的值是不是過期了,當處理器發(fā)現(xiàn)自己緩存行對應的內(nèi)存地址被修改,就會將當前處理器的緩存行設(shè)置成無效狀態(tài),當處理器對這個數(shù)據(jù)進行修改操作的時候,會重新從系統(tǒng)內(nèi)存中把數(shù)據(jù)讀到處理器緩存里。
2.具體實現(xiàn)原則:
1)Lock前綴指令會引起處理器緩存回寫到內(nèi)存。Lock前綴指令導致在執(zhí)行指令期間,聲言處理器的LOCK#信號。在多處理器環(huán)境中,LOCK#信號確保在聲言該信號期間,處理器可以獨占任何共享內(nèi)存。但是在最近的處理器里,LOCK#信號一般不鎖總線,而是鎖緩存,畢竟鎖總線開銷的比較大。鎖緩存的原理是,當訪問的內(nèi)存區(qū)域已經(jīng)緩存在處理器內(nèi)部,處理器會鎖定這塊內(nèi)存區(qū)域的緩存行并回寫到內(nèi)存,并使用緩存一致性機制來確保修改的原子性,緩存一致性機制會阻止同時修改由兩個以上處理器緩存的內(nèi)存區(qū)域數(shù)據(jù)。
2)一個處理器的緩存回寫到內(nèi)存會導致其他處理器的緩存無效。處理器使用嗅探技術(shù)保證它的內(nèi)部緩存、系統(tǒng)內(nèi)存和其他處理器的緩存的數(shù)據(jù)在總線上保持一致。例如P6 family處理器中,如果通過嗅探一個處理器來檢測其他處理器打算寫內(nèi)存地址,而這個地址當前處于共享狀態(tài),那么正在嗅探的處理器將使它的緩存行無效,在下次訪問相同內(nèi)存地址時,強制執(zhí)行緩存行填充。
3.volatile的使用優(yōu)化
1)追加字節(jié)優(yōu)化性能:在JDK1.7的并發(fā)包里新增一個隊列集合類Linked-TransferQueue,它使用volatile變量時,用一種追加字節(jié)的方式來優(yōu)化隊列出隊和入隊的性能。
/**隊列中的頭部節(jié)點*/
private transient final PaddedAtomicReference<QNode> head;
/**隊列中的尾部節(jié)點*/
private transient final PaddedAtomicReference?tail;
static final class?PaddedAtomicReference <T> extends?AtomicReference <T>{
????//使用很多4個字節(jié)的引用追加到64個字節(jié)
? ? Object p0,p1,p2,p4,p5,p6,p7,p8,p9,pa,pb,pc,pd,pe;
? ??PaddedAtomicReference(T r){
? ? ? ? super(r);
????}
}
public class?AtomicReference <V> implements java.io.Serializable {
? ? private volatile V value;
? ? //省略其他代碼。
}
上述類,他使用一個內(nèi)部類類型來定義隊列的頭節(jié)點和尾節(jié)點,而這個內(nèi)部類相對于父類AtomicReference只做了一件事情,就是將共享變量追加到64字節(jié)。因為對于很多的處理器來說,他們的高速緩存行L1、L2和L3是64字節(jié)寬,不支持部分填充緩存行。這意味著隊列的頭節(jié)點和尾節(jié)點都不足64字節(jié)的話,處理器會將它們都讀到同一個高速緩存行中,再多處理器下每個處理器都會緩存同樣的頭節(jié)點和尾節(jié)點,當一個處理器試圖修改頭節(jié)點時,會將整個緩存行鎖定,那么在緩存一致性機制的影響下,其他的處理器將不能訪問它們的尾節(jié)點,而隊列的入隊列和出隊列操作則需要不停的修改頭節(jié)點和尾節(jié)點,所以在多處理的情況下將會嚴重影響到隊列的入隊和出隊效率。追加到64字節(jié)的方式來填滿告訴緩沖區(qū)的緩存行,避免頭節(jié)點和尾節(jié)點加載到同一個緩存行,使頭、尾節(jié)點在修改時不會互相鎖定。
如果共享變量不被頻繁寫的話,鎖的幾率也非常小,就沒必要通過追加字節(jié)的方式來避免相互鎖定。
但是這種追加字節(jié)的方式在Java7下可能不生效,因為Java7變得更加智慧,他會淘汰或重新排列無用字段,需要使用其他追加字節(jié)的方式。