簡介
正則表達式:Regular Expression
是一種文本模式,包括普通字符(例如,a
到 z
之間的字母,數字)和特殊字符(稱為"元字符")。
正則表達式使用單個字符串來描述、匹配一系列匹配某個句法規則的字符串。
很強大,提高效率。
為何使用正則表達式?
測試字符串內的模式。
例如,可以測試輸入字符串,以查看字符串內是否出現電話號碼模式或信用卡號碼模式。這稱為數據驗證。替換文本。
可以使用正則表達式來識別文檔中的特定文本,完全刪除該文本或者用其他文本替換它。基于模式匹配從字符串中提取子字符串。
可以查找文檔內或輸入域內特定的文本。
python正則表達式學習:http://www.runoob.com/python/python-reg-expressions.html
語法
正則表達式(regular expression
)描述了一種字符串匹配的模式(pattern
),可以用來檢查一個串是否含有某種子串、將匹配的子串替換或者從某個串中取出符合某個條件的子串等。
普通字符包括沒有顯式指定為元字符的所有可打印和不可打印字符。這包括所有大寫和小寫字母、所有數字、所有標點符號和一些其他符號。
非打印字符:
非打印字符也可以是正則表達式的組成部分。下表列出了表示非打印字符的轉義序列:
特殊字符:
所謂特殊字符,就是一些有特殊含義的字符,如上面說的 runoo*b 中的 *,簡單的說就是表示任何字符串的意思。如果要查找字符串中的 * 符號,則需要對 * 進行轉義,即在其前加一個 : runo*ob 匹配 runo*ob
。
注意:換行符與回車符區別:http://www.cnblogs.com/yunf/archive/2011/04/20/2021830.html
制表符:
制表符可以用來制作表格,它們在第9區。它們有:
┌ └ ┐ ┘ ─ │ ├ ┤ ┬ ┴ ┼