[Leetcode]10. 正則表達式匹配

題目描述:
給定一個字符串 (s) 和一個字符模式 (p)。實現支持 '.' 和 '' 的正則表達式匹配。
'.' 匹配任意單個字符。
'
' 匹配零個或多個前面的元素。

匹配應該覆蓋整個字符串 (s) ,而不是部分字符串。
說明:
s 可能為空,且只包含從 a-z 的小寫字母。
p 可能為空,且只包含從 a-z 的小寫字母,以及字符 . 和 *。

  • 示例 1:
    輸入:
    s = "aa"
    p = "a"
    輸出: false
    解釋: "a" 無法匹配 "aa" 整個字符串。

  • 示例 2:
    輸入:
    s = "aa"
    p = "a"
    輸出: true
    解釋: '
    ' 代表可匹配零個或多個前面的元素, 即可以匹配 'a' 。因此, 重復 'a' 一次, 字符串可變為 "aa"。

  • 示例 3:
    輸入:
    s = "ab"
    p = "."
    輸出: true
    解釋: ".
    " 表示可匹配零個或多個('*')任意字符('.')。

  • 示例 4:
    輸入:
    s = "aab"
    p = "cab"
    輸出: true
    解釋: 'c' 可以不被重復, 'a' 可以被重復一次。因此可以匹配字符串 "aab"。

  • 示例 5:
    輸入:
    s = "mississippi"
    p = "misisp*."
    輸出: false

笨辦法1:
直接逐個字母的比對肯定是不行的。我能夠想到的一個也許可行的思路是:使用list+dict來記錄整個字符串。具體來說,就是記錄下字符串中每個字符連續出現的次數。比如:aab記錄為[{'a':2},{'b':1}],mississippi記錄為[{'m':1},{'i':1},……],以此類推。而對于包含*或者.的字符串,則進行轉義。
進行轉義的時候,需要考慮以下幾種情況:

  • 字母后接時,例如a,記錄為{a:star}
  • 字母后接.時,例如a.,記錄為{a:1, dot:1}
  • .后接時,例如.,記錄為{dot:star},表示0個或多個任意字符
  • 后接.時,例如a.,記錄為{a:1+star,dot:1}
  • 開頭時,例如abc,記錄為{a:1,b:1,c:1},此時*不起作用
  • .開頭時,例如.abc,記錄為{dot:1,a:1,b:1,c:1},.相當于一個字符
    說到底,*代表的是數量,作為dict的value存在。.代表的是字符,作為dict的key存在。
    即便做了轉換,也還是無法通過逐個字符比對來判定是否匹配。說到底,這能算是一個初級的思路,最終證明難以用來解決問題。

笨辦法2:
最后,直接使用re庫的match方法。沒想到很多人也是用的re庫來解決,并不算取巧哇。因為re.match方法還是有些參數比較特別,人們也不一定清楚怎么用。re.match('a.*','ab').group(0)=='ab',這就表示匹配成功。
耗時84ms,戰勝了72%的用戶。

class Solution(object):
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        import re
        m=re.match(p,s)
        if m and m.span()[1]==len(s):
            return True
        else:
            return False

聰明的方法:
沒想到是使用遞歸+動態規劃的思路解決,當然也可以用純遞歸的思路解決。我有考慮過動態規劃,但沒有考慮過用遞歸+動態規劃的方法。
其實這題的思路,關鍵還是遞歸,為什么呢?單純匹配.很容易,關鍵是*的匹配。如果逐個字符的匹配,處理邏輯很復雜。但用遞歸來處理就簡單多了,問題就簡化為以下兩種情況:

  1. 如果s[0]==p[0] and p[1]=='*',只要s[1:]==p[2:],兩個字符串就相等。
  2. 如果s[0]==p[0] and p[1]!='*',只要s[1:]==p[1:],兩個字符串就相等。
    遞歸可以處理s中包含任意多個連續的相同字符的情況。用其余的思路都很難處理。

用時1848ms,擊敗6.7%的用戶。

class Solution(object):
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        # 如果not p非空,也就是p為空,則返回not s
        if not p:
            return not s
        # 下面處理p非空的情況
        # 檢測首字符是否相等
        first_match=bool(s) and p[0] in (s[0],'.')
        # 遞歸處理后續字符
        # 首字符相等 且 后續字符匹配
        # 考慮只有兩個字符和兩個以上字符的情況
        if len(p)>=2 and p[1]=='*':
            #同時考慮首字母不匹配和首字母匹配的情況
            return self.isMatch(s,p[2:]) or (first_match and self.isMatch(s[1:],p))
        else:
            return first_match and self.isMatch(s[1:],p[1:])

用動態規劃+遞歸的思想,可以更快的解決這個問題。這個解法的核心與遞歸解法類似,但時間復雜度是O(S*P)。該解法中,關鍵要搞清楚結束條件是:i和j同時移動到末尾。如果沒有同時移動到末尾,比如j移動到了末尾,而i只到中間位置,那么s和p便不匹配。
用時44ms,擊敗了98.5%的用戶。

class Solution(object):
    def isMatch(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: bool
        """
        memo={} #存儲動態規劃的結果
        #dp(i,j)表示s[i:]和p[j:]是否匹配
        def dp(i,j):
            if (i,j) not in memo:
                #結束條件:i和j同時移動到末尾
                if j==len(p):
                    ans=i==len(s)
                else:
                    # 類似于遞歸解法,關鍵是搞清楚dp(i,j)表示s[i:]和p[j:]是否匹配
                    first_match=i<len(s) and p[j] in (s[i],'.')
                    if j+1<len(p) and p[j+1]=='*':
                        ans=dp(i,j+2) or first_match and dp(i+1,j)
                    else:
                        ans=first_match and dp(i+1,j+1)
                memo[i,j]=ans
            return memo[i,j]
        
        return dp(0,0)
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容