正則表達式

正則表達式是對字符串進行過濾的規則

python中re模塊提供了正則表達式的匹配操作

常見匹配模式

參考


注意事項:

1.分組編號是從1開始。

2.分組的引用: \number

3.分組的別名及引用: (?P<alias>abc)(?P=alias) ? 匹配 abcabc

4.有些雖然用()括起來,但是并不是分組

5.能用非貪婪就不要用貪婪

re模塊的幾個函數

re.compile

將正則表達式編譯成正則表達式對象。

pattern = re.compile(string,flags)

match函數

從起始位置開始匹配,且只能從起始位置開始匹配,找到第一個就返回或者返回None

result = re.match(pattern,string,flags=0)

#pattern可以直接用字符串形式表示,也可以用上面的compile后的正則表達式對象

#flags 通常用到re.S,可以用.匹配換行符\n。詳見底部

result.group()

#返回結果:0表示匹配的整個串,1表示匹配的第一個分組,默認是0

search函數

掃描整個字符串,直到找到第一個就返回或者返回None

match和search比較

match必須跟字符串的頭部匹配成功,否則返回None,而search是掃描整個字符串,不需要頭部必須匹配。

結論

能用search就不要用match

findall函數

以列表的形式返回所有匹配的字符串

注意:列表中的元素將根據正則表達式的寫法。

  正則表達式如果沒有分組(包括非捕獲的括號,例如"(?:abc)"),那么返回值是整個匹配串的列表;

  如果有分組,那返回的列表元素是元組,元組的元素是同一個匹配串中的所有分組。

sub(pattern, repl, string[, count])函數

當repl是一個字符串時,可以使用\id或\g、\g引用分組,但不能使用編號0。

當repl是一個方法時,這個方法應當只接受一個參數(Match對象),并返回一個字符串用于替換(返回的字符串中不能再引用分組)。

count用于指定最多替換次數,不指定時全部替換。

s = 'i say, hello world!'

print re.sub('(\w+) (\w+)',r'\2 \1', s)

def func(m):

  return m.group(1).title() + ' ' + m.group(2).title()

print re.sub(pattern,func, s)

### output ###

# say i, world hello!

# I Say, Hello World!

#flags

? re.I(全拼:IGNORECASE): 忽略大小寫(括號內是完整寫法,下同)

? re.M(全拼:MULTILINE): 多行模式,改變'^'和'$'的行為(參見上圖)

? re.S(全拼:DOTALL): 點任意匹配模式,改變'.'的行為

? re.L(全拼:LOCALE): 使預定字符類 \w \W \b \B \s \S 取決于當前區域設定

? re.U(全拼:UNICODE): 使預定字符類 \w \W \b \B \s \S \d \D 取決于unicode定義的字符屬性

? re.X(全拼:VERBOSE): 詳細模式。這個模式下正則表達式可以是多行,忽略空白字符,并可以加入注釋。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,182評論 6 543
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,489評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,290評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,776評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,510評論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,866評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,860評論 3 447
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 43,036評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,585評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,331評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,536評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,058評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,754評論 3 349
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,154評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,469評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,273評論 3 399
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,505評論 2 379

推薦閱讀更多精彩內容

  • re模塊手冊 本模塊提供了和Perl里的正則表達式類似的功能,不關是正則表達式本身還是被搜索的字符串,都可以...
    喜歡吃栗子閱讀 4,039評論 0 13
  • 本文介紹了Python對于正則表達式的支持,包括正則表達式基礎以及Python正則表達式標準庫的完整介紹及使用示例...
    Python程序媛閱讀 1,360評論 0 22
  • 1. 正則表達式基礎 1.1. 簡單介紹 正則表達式并不是Python的一部分。正則表達式是用于處理字符串的強大工...
    隨風化作雨閱讀 361評論 0 0
  • 說明 摘抄為主,忘記是在什么地方看見的原文了。原作者別打我,若你見了請聯系我,增加你的版權和鏈接描述 整體過程 P...
    明慢慢閱讀 1,028評論 0 8
  • 夜并不靜 汽車隱約轟鳴 蟲聲此起彼伏 攪亂思緒 夢門緊閉 不知如何開啟 靈魂踏遍綠水 不肯休息 多少個夜 從黑暗到...
    雪小凝閱讀 202評論 0 1