正則表達式特性精華

目錄

一. 概念
二. 元字符總結
   1. 匹配單個字符的元字符
   2. 提供計數功能的元字符
   3. 匹配位置的元字符
   4. 其他元字符
   5. 轉義有3種情況
三. 運算符優先級

內容


一. 概念

從字符表義角度上劃分,字符可以分為:原義字符、轉義字符:

  • 原義字符: 表示字符本身的含義;
  • 轉義字符: 表示的含義與字符本身的含義不同;
  • 元字符: 正則表達式語言由兩種基本字符類型組成:原義(正常)文本字符和元字符。元字符使正則表達式具有處理能力。所謂元字符就是指那些在正則表達式中具有特殊意義的專用字符,可以用來規定其前導字符(即位于元字符前面的字符)在目標對象中的出現模式。

二. 元字符總結

1. 匹配單個字符的元字符

  • . 點號:匹配除“\r\n”之外的任何單個字符;
  • […] 字符范圍:匹配指定范圍內的任意字符;
  • [^…] 負值字符范圍:匹配任何不在指定范圍內的任意字符;
  • \char 轉義字符:若char是元字符,或轉義序列無特殊含義時,匹配char對應的普通字符;

2. 提供計數功能的元字符

  • ? 問題:匹配前面的子表達式零次或一次;
  • * 星號:匹配前面的子表達式任意次;
  • + 加號:匹配前面的子表達式一次或多次(大于等于1次);
  • {min,max} 區間量詞:最少匹配min次且最多匹配max次;min和max均為非負整數,其中min <= max;

3. 匹配位置的元字符

  • ^ 脫字符:匹配輸入字符串的開始位置;
  • $ 美元符:匹配輸入字符串的結束位置;
  • \< 單詞分界符:匹配詞(word)的開始位置;注意:這個元字符不是所有的軟件都支持的;
  • \> 單詞分界符:匹配詞(word)的結束位置;注意:這個元字符不是所有的軟件都支持的;

4. 其他元字符

  • | :將兩個匹配條件進行邏輯“或”(Or)運算;
  • (…) 括號:限定多選結構的范圍,標注量詞作用的元素,為反向引用”捕獲”文本;
  • \1,\2,… 反向引用:匹配之前的第一、第二組括號內的字表達式匹配的文本;
    使用括號的3個理由:限制多選結構、分組、捕獲文本;
  • -i參數很有用,它能忽略大小寫的匹配;

5. 轉義有3種情況:

  • \ 加上元字符,表示匹配元字符所使用的普通字符。
  • \ 加上非元字符,組成一種由具體實現方式規定其意義的元字符序列 如<表示單詞的起始邊界。
  • \ 加上任意其他字符,默認情況就是匹配此字符,也就是說,反斜線被忽略了。

三. 運算符優先級

正則表達式從左到右進行計算,并遵循優先級順序,這與算術表達式非常類似。
相同優先級的從左到右進行運算,不同優先級的運算先高后低。下表從最高到最低說明了各種正則表達式運算符的優先級順序:

運算符 描述
\ 轉義符
(), (?:), (?=), [] 圓括號和方括號
*, +, ?, {n}, {n,}, {n,m} 限定符
^, $, \任何元字符、任何字符 定位點和序列(即:位置和順序)
| 替換,"或"操作字符具有高于替換運算符的優先級,使得"m|food"匹配"m"或"food"。若要匹配"mood"或"food",請使用括號創建子表達式,從而產生"(m|f)ood"。
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容