簡介
Beam Search(集束搜索)是一種啟發(fā)式圖搜索算法,通常用在圖的解空間比較大的情況下,為了減少搜索所占用的空間和時間,在每一步深度擴(kuò)展的時候,剪掉一些質(zhì)量比較差的結(jié)點,保留下一些質(zhì)量較高的結(jié)點。這樣減少了空間消耗,并提高了時間效率,但缺點就是有可能存在潛在的最佳方案被丟棄,因此,Beam Search算法是不完全的,一般用于解空間較大的系統(tǒng)中。
該算法常用的場景如:機(jī)器翻譯,語音識別,當(dāng)系統(tǒng)的數(shù)據(jù)集比較大,計算資源受限,而且沒有唯一最優(yōu)解時,該算法能夠較快的找到接近最正確的解。
背景知識
廣度優(yōu)先搜索算法(Breadth First Search),又稱為"寬度優(yōu)先搜索"或"橫向優(yōu)先搜索",簡稱BFS,它是一種先生成的節(jié)點先擴(kuò)展的搜索策略,其具體的搜索過程:從初始節(jié)點S開始逐層向下擴(kuò)展,在第n層節(jié)點還沒有完全搜索完之前,不會進(jìn)入第n+1層節(jié)點進(jìn)行搜索。
流程如下圖:
第1步:訪問A。
第2步:依次訪問C,D,F。
在訪問了A之后,接下來訪問A的鄰接點。前面已經(jīng)說過,在本文實現(xiàn)中,頂點ABCDEFG按照順序存儲的,C在"D和F"的前面,因此,先訪問C。再訪問完C之后,再依次訪問D,F。
第3步:依次訪問B,G。
在第2步訪問完C,D,F之后,再依次訪問它們的鄰接點。首先訪問C的鄰接點B,再訪問F的鄰接點G。
第4步:訪問E。
在第3步訪問完B,G之后,再依次訪問它們的鄰接點。只有G有鄰接點E,因此訪問G的鄰接點E。
因此訪問順序是:A -> C -> D -> F -> B -> G -> E
流程
beam search可以看做是做了約束優(yōu)化的廣度優(yōu)先搜索,首先使用廣度優(yōu)先策略建立搜索樹,樹的每層,按照啟發(fā)代價對節(jié)點進(jìn)行排序,然后僅留下預(yù)先確定的個數(shù)(Beam width-集束寬度)的節(jié)點,僅這些節(jié)點在下一層次繼續(xù)擴(kuò)展,其他節(jié)點被剪切掉。
1、將初始節(jié)點插入到list中,
2、將給節(jié)點出堆,如果該節(jié)點是目標(biāo)節(jié)點,則算法結(jié)束;
3、否則擴(kuò)展該節(jié)點,取集束寬度的節(jié)點入堆。然后到第二步繼續(xù)循環(huán)。
4、算法結(jié)束的條件是找到最優(yōu)解或者堆為空。
在使用上,集束寬度可以是預(yù)先約定的,也可以是變化的,具體可以根據(jù)實際場景調(diào)整設(shè)定。
算法實現(xiàn)
/*初始化 */
g = 0;//步數(shù)
hash_table = { start };//hash表,用于標(biāo)記所有已經(jīng)訪問過的節(jié)點。類似于close表
BEAM = { start };//BEAM 一個容量受限的open表,也就是在初始化時,需要指定open表的容量
while(BEAM ≠ ?){// 循環(huán)直到BEAM為空,也就是沒有需要考察的節(jié)點了
SET = ?;// 設(shè)置集合為空
for(each state in BEAM){ //對于BEAM中的每個狀態(tài)state
for(each successor of state){ // 對于state的每個后繼successor
if(successor == goal) return g + 1;// 如果后繼就是目標(biāo)節(jié)點,那么找到了一個路徑。
SET = SET ∪ { successor }; // 否則,后繼加入到集合中
}
}//for
BEAM = ?; // 因為open表中的內(nèi)容已經(jīng)處理完畢,清空open表
g = g + 1; // 又訪問了一層
/* fill the BEAM for the next loop */
while((SET ≠ ?) AND (B > |BEAM|)){ // 集合不空并且open表沒有滿 BEAM是容量為B的open表
state = successor in SET with smallest h value; //從集合中選出最好的點 h參考備注1
SET = SET \ { state }; // 從集合中刪除該節(jié)點
if(state ? hash_table){ // 該狀態(tài)還沒有考察過 則state不在hash_table中
if(hash_table is full) return ∞; // hash表滿了 算法已經(jīng)沒法執(zhí)行下去 當(dāng)然沒能找到路徑
hash_table = hash_table ∪ { state }; //state已經(jīng)考慮過 添加到hash_table中
BEAM = BEAM ∪ { state }; //state添加到BEAM中等待判斷
}//if
}//while
// 注意 有可能集合不空 但是BEAM已經(jīng)滿了
// 根據(jù)算法 集合會被清空 集合中的點將不再考慮
// 因此該算法不是完備的
// 也就是說 有可能原問題有解,但是由于這里舍棄了一些中間過程
// 導(dǎo)致最終無法獲得解
}//while
// goal was not found, and BEAM is empty - Beam Search failed to find the goal
return ∞;//沒能找到路徑