http://blog.csdn.net/sjf0115/article/details/8579484
KMP字符串模式匹配通俗點說就是一種在一個字符串中定位另一個串的高效算法。簡單匹配算法的時間復雜度為O(m*n);KMP匹配算法。可以證明它的時間復雜度為O(m+n).。
</br>
在S=”abcabcabdabba”中查找T=”abcabd”,如果使用KMP匹配算法,當第一次搜索到S[5] 和T[5]不等后,S下標不是回溯到1,T下標也不是回溯到開始,而是根據T中T[5]==’d’的模式函數值(next[5]=2,為什么?后面講),直接比較S[5] 和T[2]是否相等。
</br>
所以這個模式函數是怎么得到的?
定義:
- (1)next[0]= -1 意義:任何串的第一個字符的模式值規定為-1。
- (2)next[j]= -1 意義:模式串T中下標為j的字符,如果與首字符相同,且j的前面的1—k個字符與開頭的1—k
個字符不等(或者相等但T[k]==T[j])(1≤k<j)。
如:T=”abCabCad” 則 next[6]=-1,因T[3]=T[6] - (3)next[j]=k 意義:模式串T中下標為j的字符,如果j的前面k個字符與開頭的k個字符相等,且T[j] != T[k] (1≤k<j)。
T[j-k]T[j-k+1]T[j-k+2]…T[j-1]
且T[j] != T[k].(1≤k<j); ```
+ (4) next[j]=0 意義:除(1)(2)(3)的其他情況。
鏈接:https://www.nowcoder.com/questionTerminal/57bdf294407c4477969fc7b4d56c7be7來源:牛客網首先看看next數組值的求解方法例如:
模式串 a b a a b c a c
next值 0 1 1 2 2 3 1 2
next數組的求解方法是:
第一位的next值為0,第二位的next值為1,后面求解每一位的next值時,根據前一位進行比較。首先將前一位與其next值對應的內容進行比較,如果相等,則該位的next值就是前一位的next值加上1;如果不等,向前繼續尋找next值對應的內容來與前一位進行比較,直到找到某個位上內容的next值對應的內容與前一位相等為止,則這個位對應的值加上1即為需求的next值;如果找到第一位都沒有找到與前一位相等的內容,那么需求的位上的next值即為1。
看起來很令人費解,利用上面的例子具體運算一遍。
1.前兩位必定為0和1。
2.計算第三位的時候,看第二位b的next值,為1,則把b和1對應的a進行比較,不同,則第三位a的next的值為1,因為一直比到最前一位,都沒有發生比較相同的現象。
3.計算第四位的時候,看第三位a的next值,為1,則把a和1對應的a進行比較,相同,則第四位a的next的值為第三位a的next值加上1。為2。因為是在第三位實現了其next值對應的值與第三位的值相同。
4.計算第五位的時候,看第四位a的next值,為2,則把a和2對應的b進行比較,不同,則再將b對應的next值1對應的a與第四位的a進行比較,相同,則第五位的next值為第二位b的next值加上1,為2。因為是在第二位實現了其next值對應的值與第四位的值相同。
5.計算第六位的時候,看第五位b的next值,為2,則把b和2對應的b進行比較,相同,則第六位c的next值為第五位b的next值加上1,為3,因為是在第五位實現了其next值對應的值與第五位相同。
6.計算第七位的時候,看第六位c的next值,為3,則把c和3對應的a進行比較,不同,則再把第3位a的next值1對應的a與第六位c比較,仍然不同,則第七位的next值為1。
7.計算第八位的時候,看第七位a的next值,為1,則把a和1對應的a進行比較,相同,則第八位c的next值為第七位a的next值加上1,為2,因為是在第七位和實現了其next值對應的值與第七位相同。
復雜度:O(n+m)