不論是前端還是后端,正則表達(dá)式好像是大家避不開的一個(gè)東西;很多小伙伴糾結(jié)于正則表達(dá)式很難,很晦澀,我最近看到網(wǎng)上的教程有些比較晦澀,現(xiàn)在我就介紹一下正則表達(dá)式,期望大家能夠快速入門。
一直以來我覺得學(xué)一個(gè)東西需要了解著三個(gè)問題:
- 為什么會(huì)有這個(gè)東西 (即:出現(xiàn)問題)
- 怎么用這個(gè)東西 (即:解決問題)
- 這個(gè)東西是怎么實(shí)現(xiàn)的 (即:怎么解決的問題,一般是進(jìn)階或者想深入了解才會(huì)去探究,此處忽略)
針對(duì)到正則表達(dá)式上就是:
- 為什么會(huì)有正則表達(dá)式
- 正則表達(dá)式怎么用
下面就這兩個(gè)問題我們做講述
-
正則表達(dá)式的產(chǎn)生原因
大家在處理自己的任務(wù)的過程中,經(jīng)常會(huì)遇到,想要看一個(gè)字符串是否是符合要求的,字符傳中是否包含想要的字符串等;例如我想知道用戶輸入的一個(gè)字符串是否是合法的郵箱地址,例如我想看用戶輸入的字符傳中是否包含合法的郵箱地址,例如我想把這串字符串中可能出現(xiàn)的合法郵箱地址給截取出來;這些東西怎么處理呢,有的小伙伴可能會(huì)想到直接用所用語言的字符串處理函數(shù),這種直接用所使用語言的字符串處理函數(shù)的方式,對(duì)于簡單的來說還可以接受,但是稍微復(fù)雜一些就動(dòng)輒幾十行代碼不能解決問題。
其實(shí)在很久之前就有這些問題了,于是一個(gè)大神 Ken Thompson 就發(fā)明了這個(gè)正則表達(dá)式用來處理這個(gè)問題,他用一個(gè)串有特殊含義的字符串來表達(dá)一個(gè)符合某項(xiàng)特征的字符串,例如他用
\d{3}-\d{5}
來表示所有三個(gè)數(shù)字加一個(gè)-
再加5個(gè)數(shù)字的字符串,即形如'333-55555'
的字符串。(這類似于 數(shù)學(xué)中我們用x+y=10
,來表示兩個(gè)和為10的所有數(shù)字組合)其實(shí)一句話總結(jié):正則表達(dá)式就是用來匹配處理字符串的工具(一點(diǎn)個(gè)人理解:正則表達(dá)式大家可以理解為 正確符合我們約定的規(guī)則的字符串的表達(dá)式,這樣可以破解大家對(duì)于這個(gè)語法糖的恐懼感)
-
正則表達(dá)式怎么用
首先正則表達(dá)式是一個(gè)表達(dá)式,我們需要先有意思想要去表達(dá),才能用。
最簡單的,我想寫一個(gè)只有一個(gè)數(shù)字的字符串,那怎么用正則表達(dá)式表達(dá)只有一個(gè)數(shù)字的字符串呢。 用正則表達(dá)式表達(dá)應(yīng)為
\d
,所以\d
就是一個(gè)正則表達(dá)式,它用于表示所有只有一個(gè)數(shù)字的字符串,我們可以用它來匹陪所有只有一個(gè)數(shù)字的字符串;那么我想表示更復(fù)雜的怎么辦呢,例如我想表示 一個(gè)數(shù)字再加一個(gè)字母 的字符串,怎么辦呢?可以想象的是 可以匹配 一個(gè)數(shù)字再加一個(gè)字母 的正則表達(dá)式也是一串特殊字符,只是我們還不知道怎么表達(dá),那么我們只需要進(jìn)一步了解一下正則表達(dá)式的語法就可以了,即我們需要了解一下怎么寫正則表達(dá)式就可以了。
正則表達(dá)式的入門篇語法:
-
所有非正則表達(dá)式約定的特殊字符外均表示自己,例如
'34'
表示 所有字符串是'34'
的字符串,這顯然只有'34'
這一個(gè)字符串 (對(duì)于哪些是正則表達(dá)式約定的特殊字符 我們需要通過了解下面語法來記住)-
'\d'
用于表示一個(gè)數(shù)字 -
'\w'
用于表示一個(gè)字母或數(shù)字,例如:'8'
,'x'
,'d'
-
'\s'
用于表示一個(gè)空格 即' '
-
'.'
用于表示一個(gè)任意字符,例如:'8'
,'x'
,'d'
,' '
,'='
,'+'
,'{'
-
-
那么我們要表示連續(xù)三個(gè)數(shù)字呢,
'\d\d\d'
顯然是可以的,那么我要表所示連續(xù)100的數(shù)字呢,連續(xù) 100個(gè)'\d'
就太復(fù)雜了,那怎么表示這個(gè)呢,類似于正則表達(dá)式中的乘法出現(xiàn)了'\d{3}'
表示連續(xù)三個(gè)數(shù)字組成的字符串,例如'123'
,'111'
把這種語法應(yīng)用于上面4種,情況得到:
-
'3{3}'
用于表示連續(xù)三個(gè)'3'
組成的字符串,顯然只有'333'
-
'\d{3}'
用于表示連續(xù)三個(gè)數(shù)字 組成的字符串,如:'123'
,'111'
-
'\w{3}'
用于表示連續(xù)三個(gè)數(shù)字或字母組成的字符換,如:'qw1'
,'111'
-
'.{3}'
用于表示連續(xù)三個(gè)任意字符組成的字符串,如:'xxx'
,'x-1'
,'=+<'
那么如果我們想要表示x~y個(gè)字符組成的字符串呢,于是出現(xiàn)了:
'\d{2,5}'
用于表示2-5個(gè)數(shù)字組成的字符串 ,如'12'
,'1234'
,'34215'
同理:
'\w{1,10}'
表示 1-10個(gè)字母組成的字符串'.{2-8}'
表示 2-8個(gè)任意字符組的字符串,'1{3,7}'
表示 3-7個(gè)'1'組成的字符串
還要一個(gè)問題,如果我想表達(dá)至少1個(gè),至多到無窮個(gè)的字符串呢,正則表達(dá)式有沒有類似于∞的字符呢,其實(shí)是沒有的,但有相似的:我們用
'*'
表示 0-∞個(gè),'+'
表示1-∞個(gè),如'3*'
,'\d*'
分別表示0到無窮多個(gè)3組成的字符串,1到無窮個(gè)數(shù)字組成的字符串 -
-
ok,現(xiàn)在我們已經(jīng)基本入門了正則表達(dá)式了,先在我們稍微在深入一點(diǎn)。首先解決的一個(gè)需求是,我們想表達(dá)只由1,2,3 這3個(gè)數(shù)字組成的怎么辦:
-
'[123]{3,5}'
表示一個(gè)長度為3到5的字符串,其元素只能是元素集合'1'
,'2'
,'3'
的子集,其中 中括號(hào) 內(nèi)表示的是可選的集合
然后我們想表示只由小寫字目a到y(tǒng)這25個(gè)字母組成的任意長度字符串怎么辦,我需要在正則表達(dá)式里寫25個(gè)字母嗎?顯然不需要,于是:
-
'[a-y]*'
表示從a到y(tǒng)的集合的子集表示的任意長度的字符串
你應(yīng)該常常見到
[0-9a-zA-Z]
這種寫法,則是表示一個(gè)數(shù)字或字母,類似于'\w'
了另外如果我想匹配一個(gè) 由'A'或'B'組成的字符串呢,其實(shí)我們用上面的知識(shí)可以寫出來:
'[AB]'
則表示一個(gè)由A或B組成的一個(gè)字符串,有沒有更方便的寫法呢,于是- 'A|B' 出現(xiàn),表示一個(gè)匹配'A'或匹配'B'的表達(dá)式
-
另外常用的匹配行開始匹配結(jié)束的字符是 ^和$
- 這樣最最基本的正則表達(dá)式就解釋完了。
- 另外這篇是針對(duì)新編程不久的新手的教程,摻雜了一些我自己在學(xué)習(xí)的過程中的一些疑惑點(diǎn)的解釋,可能對(duì)有些人都是不必要講的。
- 另另外歡迎各位拍磚留言。