python正則表達(dá)式==========
\w可以匹配一個字母或數(shù)字
.可以匹配任意字符
*表示任意個字符(包括0個),用+表示至少一個字符,用?表示0個或1個字符,用{n}表示n個字符,用{n,m}表示n-m個字符:
\d{3}表示匹配3個數(shù)字,例如'010'
\s+表示至少有一個空格
\d{3,8}表示3-8個數(shù)字,例如'1234567'
[0-9a-zA-Z\_]可以匹配一個數(shù)字、字母或者下劃線;
[0-9a-zA-Z\_]+可以匹配至少由一個數(shù)字、字母或者下劃線組成的字符串,比如'a100','0_Z','Py3000'
a-zA-Z\_][0-9a-zA-Z\_]{0, 19}更精確地限制了變量的長度是1-20個字符(前面1個字符+后面最多19個字符)
A|B可以匹配A或B,所以(P|p)ython可以匹配'Python'或者'python'
^表示行的開頭,^\d表示必須以數(shù)字開頭
$表示行的結(jié)束,\d$表示必須以數(shù)字結(jié)束。
py也可以匹配'python',但是加上^py$就變成了整行匹配,就只能匹配'py'了
re.match(r'正則表達(dá)式', test)
match()方法判斷是否匹配,如果匹配成功,返回一個Match對象,否則返回None
re.split(r'\s+', 'a b? c')
['a', 'b', 'c']
>>> re.split(r'[\s\,]+', 'a,b, c? d')
['a', 'b', 'c', 'd']
>>> import re
# 編譯:
>>> re_telephone = re.compile(r'^(\d{3})-(\d{3,8})$')
# 使用:
>>> re_telephone.match('010-12345').groups()
('010', '12345')