題目描述:
給定一個字符串 (s) 和一個字符模式 (p)。實現支持 '.' 和 '' 的正則表達式匹配。
'.' 匹配任意單個字符。
'' 匹配零個或多個前面的元素。
匹配應該覆蓋整個字符串 (s) ,而不是部分字符串。
說明:
s 可能為空,且只包含從 a-z 的小寫字母。
p 可能為空,且只包含從 a-z 的小寫字母,以及字符 . 和 *。
示例 1:
輸入:
s = "aa"
p = "a"
輸出: false
解釋: "a" 無法匹配 "aa" 整個字符串。示例 2:
輸入:
s = "aa"
p = "a"
輸出: true
解釋: '' 代表可匹配零個或多個前面的元素, 即可以匹配 'a' 。因此, 重復 'a' 一次, 字符串可變為 "aa"。示例 3:
輸入:
s = "ab"
p = "."
輸出: true
解釋: "." 表示可匹配零個或多個('*')任意字符('.')。示例 4:
輸入:
s = "aab"
p = "cab"
輸出: true
解釋: 'c' 可以不被重復, 'a' 可以被重復一次。因此可以匹配字符串 "aab"。示例 5:
輸入:
s = "mississippi"
p = "misisp*."
輸出: false
笨辦法1:
直接逐個字母的比對肯定是不行的。我能夠想到的一個也許可行的思路是:使用list+dict來記錄整個字符串。具體來說,就是記錄下字符串中每個字符連續出現的次數。比如:aab記錄為[{'a':2},{'b':1}],mississippi記錄為[{'m':1},{'i':1},……],以此類推。而對于包含*或者.的字符串,則進行轉義。
進行轉義的時候,需要考慮以下幾種情況:
- 字母后接時,例如a,記錄為{a:star}
- 字母后接.時,例如a.,記錄為{a:1, dot:1}
- .后接時,例如.,記錄為{dot:star},表示0個或多個任意字符
- 后接.時,例如a.,記錄為{a:1+star,dot:1}
- 開頭時,例如abc,記錄為{a:1,b:1,c:1},此時*不起作用
- .開頭時,例如.abc,記錄為{dot:1,a:1,b:1,c:1},.相當于一個字符
說到底,*代表的是數量,作為dict的value存在。.代表的是字符,作為dict的key存在。
即便做了轉換,也還是無法通過逐個字符比對來判定是否匹配。說到底,這能算是一個初級的思路,最終證明難以用來解決問題。
笨辦法2:
最后,直接使用re庫的match方法。沒想到很多人也是用的re庫來解決,并不算取巧哇。因為re.match方法還是有些參數比較特別,人們也不一定清楚怎么用。re.match('a.*','ab').group(0)=='ab',這就表示匹配成功。
耗時84ms,戰勝了72%的用戶。
class Solution(object):
def isMatch(self, s, p):
"""
:type s: str
:type p: str
:rtype: bool
"""
import re
m=re.match(p,s)
if m and m.span()[1]==len(s):
return True
else:
return False
聰明的方法:
沒想到是使用遞歸+動態規劃的思路解決,當然也可以用純遞歸的思路解決。我有考慮過動態規劃,但沒有考慮過用遞歸+動態規劃的方法。
其實這題的思路,關鍵還是遞歸,為什么呢?單純匹配.很容易,關鍵是*的匹配。如果逐個字符的匹配,處理邏輯很復雜。但用遞歸來處理就簡單多了,問題就簡化為以下兩種情況:
- 如果s[0]==p[0] and p[1]=='*',只要s[1:]==p[2:],兩個字符串就相等。
- 如果s[0]==p[0] and p[1]!='*',只要s[1:]==p[1:],兩個字符串就相等。
遞歸可以處理s中包含任意多個連續的相同字符的情況。用其余的思路都很難處理。
用時1848ms,擊敗6.7%的用戶。
class Solution(object):
def isMatch(self, s, p):
"""
:type s: str
:type p: str
:rtype: bool
"""
# 如果not p非空,也就是p為空,則返回not s
if not p:
return not s
# 下面處理p非空的情況
# 檢測首字符是否相等
first_match=bool(s) and p[0] in (s[0],'.')
# 遞歸處理后續字符
# 首字符相等 且 后續字符匹配
# 考慮只有兩個字符和兩個以上字符的情況
if len(p)>=2 and p[1]=='*':
#同時考慮首字母不匹配和首字母匹配的情況
return self.isMatch(s,p[2:]) or (first_match and self.isMatch(s[1:],p))
else:
return first_match and self.isMatch(s[1:],p[1:])
用動態規劃+遞歸的思想,可以更快的解決這個問題。這個解法的核心與遞歸解法類似,但時間復雜度是O(S*P)。該解法中,關鍵要搞清楚結束條件是:i和j同時移動到末尾。如果沒有同時移動到末尾,比如j移動到了末尾,而i只到中間位置,那么s和p便不匹配。
用時44ms,擊敗了98.5%的用戶。
class Solution(object):
def isMatch(self, s, p):
"""
:type s: str
:type p: str
:rtype: bool
"""
memo={} #存儲動態規劃的結果
#dp(i,j)表示s[i:]和p[j:]是否匹配
def dp(i,j):
if (i,j) not in memo:
#結束條件:i和j同時移動到末尾
if j==len(p):
ans=i==len(s)
else:
# 類似于遞歸解法,關鍵是搞清楚dp(i,j)表示s[i:]和p[j:]是否匹配
first_match=i<len(s) and p[j] in (s[i],'.')
if j+1<len(p) and p[j+1]=='*':
ans=dp(i,j+2) or first_match and dp(i+1,j)
else:
ans=first_match and dp(i+1,j+1)
memo[i,j]=ans
return memo[i,j]
return dp(0,0)