目錄
一. 概念
二. 元字符總結
1. 匹配單個字符的元字符
2. 提供計數功能的元字符
3. 匹配位置的元字符
4. 其他元字符
5. 轉義有3種情況
三. 運算符優先級
內容
一. 概念
從字符表義角度上劃分,字符可以分為:原義字符、轉義字符:
- 原義字符: 表示字符本身的含義;
- 轉義字符: 表示的含義與字符本身的含義不同;
- 元字符: 正則表達式語言由兩種基本字符類型組成:原義(正常)文本字符和元字符。元字符使正則表達式具有處理能力。所謂元字符就是指那些在正則表達式中具有特殊意義的專用字符,可以用來規定其前導字符(即位于元字符前面的字符)在目標對象中的出現模式。
二. 元字符總結
1. 匹配單個字符的元字符
-
.
點號:匹配除“\r\n”之外的任何單個字符; -
[…]
字符范圍:匹配指定范圍內的任意字符; -
[^…]
負值字符范圍:匹配任何不在指定范圍內的任意字符; -
\char
轉義字符:若char是元字符,或轉義序列無特殊含義時,匹配char對應的普通字符;
2. 提供計數功能的元字符
-
?
問題:匹配前面的子表達式零次或一次; -
*
星號:匹配前面的子表達式任意次; -
+
加號:匹配前面的子表達式一次或多次(大于等于1次); -
{min,max}
區間量詞:最少匹配min次且最多匹配max次;min和max均為非負整數,其中min <= max;
3. 匹配位置的元字符
-
^
脫字符:匹配輸入字符串的開始位置; -
$
美元符:匹配輸入字符串的結束位置; -
\<
單詞分界符:匹配詞(word)的開始位置;注意:這個元字符不是所有的軟件都支持的; -
\>
單詞分界符:匹配詞(word)的結束位置;注意:這個元字符不是所有的軟件都支持的;
4. 其他元字符
-
|
:將兩個匹配條件進行邏輯“或”(Or)運算; -
(…)
括號:限定多選結構的范圍,標注量詞作用的元素,為反向引用”捕獲”文本; -
\1,\2,…
反向引用:匹配之前的第一、第二組括號內的字表達式匹配的文本;
使用括號的3個理由:限制多選結構、分組、捕獲文本; -
-i
參數很有用,它能忽略大小寫的匹配;
5. 轉義有3種情況:
-
\
加上元字符,表示匹配元字符所使用的普通字符。 -
\
加上非元字符,組成一種由具體實現方式規定其意義的元字符序列 如<表示單詞的起始邊界。 -
\
加上任意其他字符,默認情況就是匹配此字符,也就是說,反斜線被忽略了。
三. 運算符優先級
正則表達式從左到右進行計算,并遵循優先級順序,這與算術表達式非常類似。
相同優先級的從左到右進行運算,不同優先級的運算先高后低。下表從最高到最低說明了各種正則表達式運算符的優先級順序:
運算符 | 描述 |
---|---|
\ | 轉義符 |
(), (?:), (?=), [] | 圓括號和方括號 |
*, +, ?, {n}, {n,}, {n,m} | 限定符 |
^, $, \任何元字符、任何字符 | 定位點和序列(即:位置和順序) |
| | 替換,"或"操作字符具有高于替換運算符的優先級,使得"m|food"匹配"m"或"food"。若要匹配"mood"或"food",請使用括號創建子表達式,從而產生"(m|f)ood"。 |