首次接觸無鎖數據結構的設計,請各位大佬多多指教~~~
CAS(Compare && Swap)原子操作
CAS是無鎖(lock free)的數據結構的基礎。用偽代碼描述:
input: reg, old_val, new_val
/*是old_val, reg替換為new_val,返回為true;否則返回為false*/
if (* reg == old_val) {
* reg == new_val;
return true;
} else {
return false;
}
CAS相似的原子操作:
fetch and add,一般用來對變量做+1的原子操作
test and set, 寫值到內存位置并傳回其舊值
test test and set : 和雙檢查鎖一樣為了減少對鎖的多次競爭,對鎖的競爭代價比普通判斷鎖的狀態要大,這里需要著重強調,在high level programming的背景下,盡量少用雙重檢測鎖的形式,因為第二次檢查和設置并不一定是原子操作。test test and set偽代碼(Wikipedia test test and set)如下:
boolean locked := false // shared lock variable
procedure EnterCritical() {
do {
while (locked == true) skip // spin until lock seems free
} while TestAndSet(locked) // actual atomic locking, this cost of step >> the cost above !!!;
}
在此稍微記錄一下,
- GCC的原子CAS的API
bool __sync_bool_compare_and_swap (type *ptr, type oldval type newval, ...)
type __sync_val_compare_and_swap (type *ptr, type oldval type newval, ...)
- C++11的CAS
C++11的STL中的atomic類的函數可以跨平臺。
template< class T >
bool atomic_compare_exchange_weak( std::atomic* obj,
T* expected, T desired );
template< class T >
bool atomic_compare_exchange_weak( volatile std::atomic* obj,
T* expected, T desired );
無鎖隊列的鏈表實現
EnQueue(x) {
// 準備新加入的結點數據
q = new record();
q->value = x;
q->next = NULL;
do {
p = tail; // 鏈表尾指針的快照
} while( CAS(p->next, NULL, q)!= true)
CAS(tail, p, q);
}
do while的Re-Try-Loop,如果別的進程已經加成功了,tail就變了,p!=tail, p->next!= NULL,那么就重試。
這里存在一個問題,如果在CAS(tail, p, q)之前線程掛掉了或者停掉了,其它線程更新了p->next,卻沒有更新tail,然后就一直進入死循環。為了解決這個問題,下面推出了改良版的EnQueue()
EnQueue(x)
{
q = new record();
q->value = x;
q->next = NULL;
p = tail;
oldp = p;
do {
while (p->next!= NULL) {
p = p->next;
} while (CAS(p->next, NULL, q)!= TRUE); // 如果沒有把結點鏈在尾上,再試
CAS (tail , oldp, q); // 置尾結點
}
}
fetch會很影響性能, 所以可以結合以上兩個版本,如果retry的次數超過一個閾值,那么自己就fetch指針。
但是這里存在一個問題,就oldq能不能及時更新,若不能及時更新,其余線程在插入時會插到未定義的位置。個人覺得還是選擇未改良版比較好。
DeQueue // 出隊列
DeQueue() {
do {
p = head;
if (p -> next == NULL) {
return ERR_EMPTY_QUEUE;
}
} while ( CAS(head, p, p->next)!= TRUE);
return p->next->value;
}
CAS的ABA問題:
- 進程p1在共享變量中讀到值為A
- p1被搶占了,進程p2執行
- p2把共享變量里的值從A改成B,再改回到A,此時被p1搶占。
- p1回來看到共享變量里的值沒有被改變,于是繼續執行。
看來好像沒有問題,但是上式的CAS其實判斷的是指針地址,然而指針內容改變了,不就炸了?這就是內存管理中的重用內存問題。
解決ABA的問題
例如在32位系統上檢查64位的內容:
- 一次用CAS檢查雙倍長度的值,前半部分是指針,后半部分是一個計數器
- 只有這兩個都一樣,才算通過,要用該指針符新的值,計數器加1。
這種方法線程次數上應該也沒問題,但是一旦多了,可能會溢出循環計數。
所以有論文提出了使用結點內存的引用計數,這和智能指針沒啥區別嘛,但是需要保證加引用計數和減引用計數為原子操作。
用數組實現無鎖隊列
無鎖隊列可以用ring buffer實現,定位head和tail可以聲明兩個計數器,一個用來計數EnQueue的次數,一個用來計數DeQueue的次數,當隊列滿或空,可以拋出異常,沒有內存泄露的問題。
reference
[1]. 無鎖隊列的實現
[2]. 無鎖隊列的環形數組實現