正則表達式的概念及特點

很多時候我們有對Linux系統的文件進行文本檢索或者說是文本查找的需要,這時我們就需要利用到正則表達式“grep”(Regular Expression)。對需要進行檢索或查找的字符串進行邏輯操作,就是利用實現定義好的字符、及特定字符的組合,組成“規則字符串”,用來表達對字符串進行邏輯過濾。說白了就是用邏輯定義好的特定規則,利用邏輯組合成的正則表達式,檢索出符合規則的文本,這就是正則表達式。

正則表達式的特點:

  • 驗證字符串,即驗證給定的字符串或子字符串是否符合指定的特征,例如,驗證郵箱地址是否合法等。
  • 查找字符串,從給定的文本當中查找符合指定特征的字符串。
  • 替換字符串,即查找到符合特征的字符串后將其替換。
  • 提取字符串,即從給定的字符串中提取符合指定特征的子字符串。

常用字符及特殊符號:

RE字符 基礎正則表達式字符
^hello 待查找的字符串(hello)
hello$ 待查找的字符串(hello)在行尾
. 代表一定有一個任意字符的字符
\ 轉義字符,將特殊符號的特殊意義去除
* 重復零個到無窮多個的前一個字符
[list] 從字符集合的RE字符里面找出想要選取的字符
[n1-n2] 從字符集合的RE字符里面找出想要選取的字符范圍
[^list] 從字符集合的RE字符里面找出不要的字符串或范圍
{n,m} 連續n到m個的前一個RE字符,若為{n}則是連續n個的前一個RE字符,若為{n,}則是連續n個以上的前一個RE字符
RE字符 擴展正則表達式字符
重復一個或一個以上的前一個RE字符
? 零個或一個的前一個RE字符
用或(or)的方式找出數個字符
( ) 找出“組”字符串
( )+ 多個重復組的判別
特殊符號 代表意義
[[:alpha:]] 表示任意大小寫字母
[[:lower:]] 表示任意小寫字母
[[:upper:]] 表示任意大寫字母
[[:digit:]] 表示0到9之間的任意單個數字(包括0和9)
[[:alnum:]] 表示任意數字或字母
[[:space:]] 表示任意空白字符,包括"空格"、"tab鍵"等
[[:punct:]] 表示任意標點符號

實例實踐:

文件中有三行文本,每行都包含“guangdonghuizhou”這個單詞,此時可以利用grep在此文本中搜索包含“guangdonghuizhou”的行,則可以使用如下命令。

[root@centos6 ~]# grep "guangdonghuizhou" regex 
hello  guangdonghuizhou 
hi      guangdonghuizhou
hello   guangdonghuizhou

匹配到字符串每一行匹配到的都會被打印出來。


如果我們只想要打印出以“hello”開頭的行,那我們可以如下所示:

[root@centos6 ~]# grep "^hello" regex
hello guangdonghuizhou
hello   guangdonghuizhou

""表示”錨定首行“,所以"hello"表示只匹配位于首行的hello字符串。


在正則表達式中,* 代表另一個意思,在正則表達式中,* 表示之前的字符連續出現任意次(包括0次),不要與通配符中的*搞混淆了。示例如下:

[root@centos6 ~]# grep -n "e*f" regex.txt 
9:ef eef eeef

如上圖操作,"ef"表示e出現任意次,f必須跟在e的后頭。*


理解完上述符號后,我們再來認識兩個符號,"?"與"+"

  • ? 表示匹配其前面的字符0或1次,簡單理解,就是前面的字符要么有沒有,要么有一個。
  • + 表示匹配其前面的字符至少1次,簡單理解,就是前面的字符必須有至少一個。
    我們來看看示例,如下:
[root@centos6 ~]# grep "abc\?" regex.txt    
ab abc abcc

如上圖操作,”\?"表示c出現0次或者1次,都會被匹配到,所以ab和abc都被匹配到,ab被匹配到是因為c出現了0次,abc被匹配是因為出現了1次。


再來我們實踐另外一個符號,如下:

[root@centos6 ~]# grep "abc\?" regex.txt     
ab abc abcc

可以看到,abc與abcc都被匹配到了,這是因為c+"表示c至少要出現1次,至多可以連續出現多次,連續次數不封頂,所以abc和abcc都會被匹配到。

以上如有不對的地方,請批評指正。

擴展閱讀與參考文獻:

正則表達式之基本概念 - Wayne-Zhu - 博客園
正則表達式介紹與使用 - suwu150的博客 - CSDN博客
鳥哥的 Linux 私房菜 -- 第十一章、正規表示法與文件格式化處理

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,936評論 6 535
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,744評論 3 421
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,879評論 0 381
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,181評論 1 315
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,935評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,325評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,384評論 3 443
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,534評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,084評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,892評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,067評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,623評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,322評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,735評論 0 27
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,990評論 1 289
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,800評論 3 395
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,084評論 2 375

推薦閱讀更多精彩內容