next數(shù)組求解中,相信對(duì)于求解過(guò)程依賴于前一位的值。如果p[j] == s[i], 那么++j這些都容易理解,就是如果next數(shù)組中求值的這個(gè)這位的字符,如果和前綴的下一位字符繼續(xù)相同的話,說(shuō)明前綴字符串可以繼續(xù)加長(zhǎng)。這就是next數(shù)組的值=++j的意思。
但是如果不同呢,這時(shí)就需要減少前綴的長(zhǎng)度進(jìn)行比較,于是算法中給出了j=next[j],就是說(shuō)前綴長(zhǎng)度取值變成了next[j]繼續(xù)比較。
這里的確很讓人疑惑,為什么要取值next[j]呢?
在說(shuō)這個(gè)問(wèn)題之前,先要說(shuō)一個(gè)前提,就是為什么模式串下一位不同,前綴就要減少,不能增加嗎?答案是不能,如果可以增加的話,那么上一位next數(shù)組的就還可以增大,也就是j值就是不正確的。因?yàn)樯弦晃灰呀?jīng)求出了最大的j值。所以不存在更大的j值可以匹配的情況。所以下一位不同,那么j值只能減小,才能找到可能匹配的前綴。
明確了上面這個(gè)前綴長(zhǎng)度只能減少的結(jié)論。那問(wèn)題就好辦一些了。由于j要減少,對(duì)于后綴來(lái)說(shuō),也就是i指向的位置(包括i)往前的長(zhǎng)度,要減少。我們先考慮認(rèn)為長(zhǎng)度減少一個(gè)。就來(lái)研究這個(gè)長(zhǎng)度,也就是j-1長(zhǎng)度的字符串。
我們需要同時(shí)研究前綴j-1的字符串,和i前面(含i)j-1的長(zhǎng)度的字符串。這兩個(gè)字符串現(xiàn)在有什么關(guān)系呢?我們發(fā)現(xiàn),前綴除掉第一個(gè)字符剩下的字符串,剛好是不含i的后綴字符。
如果不理解,大家可以想象一下,兩個(gè)本來(lái)一樣的木頭,第一根(前綴)后面砍掉一塊,第二根前面砍掉一塊。那么他倆的關(guān)系,就是第一根前面再砍掉一塊,和第二根后面砍掉一塊,他們?nèi)匀皇且粯拥摹?/p>
明白了前綴除掉第一個(gè)字符剩下的字符串,剛好是不含i的后綴字符。這個(gè)道理,我們往下繼續(xù)。我們思考如果我們只想比較i字符串的話,就要設(shè)法找到不含i的j-1字符串, 也就是i前面j-1-1的字符串中能夠匹配到前綴一樣的這個(gè)字符串最大的那個(gè)長(zhǎng)度。而這個(gè)j-1-1的字符串剛好就在前綴中的后面。所以對(duì)于j-1的前綴。我們只需要找到它的最大前后綴,就找到了能夠匹配i前面的能匹配的最大長(zhǎng)度的前綴。
而對(duì)于j-1的前綴尋找他的最大前后綴,就是next[j]的值,前面已經(jīng)求過(guò)了。只需要取。
這就是為什么接下來(lái)j=next[j]的原理。
重置了這個(gè)指針之后,然后還是重復(fù)第一步的動(dòng)作,比較當(dāng)前值和最大前綴的后一位的值是否相同。循環(huán)往復(fù),一直查到j(luò)=1的這個(gè)最短長(zhǎng)度,就直接賦值為1,后比較下一個(gè)了。