grep (global search regular expression(RE) and print out the line,全面搜索正則表達式并把行打印出來)是一種強大的文本搜索工具,它能使用正則表達式搜索文本,并把匹配的行打印出來。除了grep,還有egrep和fgrep,egrep可以看作是grep的增強版本,支持更多re元字符,fgrep是fixed grep或fast grep,它們把所有的字母都看作單詞,也就是說,正則表達式中的元字符表示回其自身的字面意義,不再特殊。Linux使用GNU版本的grep,可以通過-G、-E、-F命令行選項來使用egrep和fgrep的功能。
查看grep工具的使用可以通過
grep --help
匹配模式選擇:
-E, --extended-regexp 擴展正則表達式egrep
-F, --fixed-strings 一個換行符分隔的字符串的集合fgrep
-G, --basic-regexp 基本正則
-P, --perl-regexp 調用的perl正則
-e, --regexp=PATTERN 后面根正則模式,默認無
-f, --file=FILE 從文件中獲得匹配模式
-i, --ignore-case 不區分大小寫
-w, --word-regexp 匹配整個單詞
-x, --line-regexp 匹配整行
-z, --null-data 一個 0 字節的數據行,但不是空行
雜項:
-s, --no-messages 不顯示錯誤信息
-v, --invert-match 顯示不匹配的行
-V, --version 顯示版本號
--help 顯示幫助信息
--mmap use memory-mapped input if possible
輸入控制:
-m, --max-count=NUM 匹配的最大數
-b, --byte-offset 打印匹配行前面打印該行所在的塊號碼。
-n, --line-number 顯示的加上匹配所在的行號
--line-buffered 刷新輸出每一行
-H, --with-filename 當搜索多個文件時,顯示匹配文件名前綴
-h, --no-filename 當搜索多個文件時,不顯示匹配文件名前綴
--label=LABEL print LABEL as filename for standard input
-o, --only-matching 只顯示一行中匹配PATTERN 的部分
-q, --quiet, --silent 不顯示任何東西
--binary-files=TYPE 假定二進制文件的TYPE 類型;
TYPE 可以是`binary', `text', 或`without-match'
-a, --text 匹配二進制的東西
-I 不匹配二進制的東西
-d, --directories=ACTION 目錄操作,讀取,遞歸,跳過
-D, --devices=ACTION 設置對設備,FIFO,管道的操作,讀取,跳過
-R, -r, --recursive 遞歸調用
--include=PATTERN 只查找匹配FILE_PATTERN 的文件
--exclude=PATTERN 跳過匹配FILE_PATTERN 的文件和目錄
--exclude-from=FILE 跳過所有除FILE 以外的文件
-L, --files-without-match 匹配多個文件時,顯示不匹配的文件名
-l, --files-with-matches 匹配多個文件時,顯示匹配的文件名
-c, --count 顯示匹配了多少次
-Z, --null 在FILE 文件最后打印空字符
文件控制:
-B, --before-context=NUM 打印匹配本身以及前面的幾個行由NUM控制
-A, --after-context=NUM 打印匹配本身以及隨后的幾個行由NUM控制
-C, --context=NUM 打印匹配本身以及隨后,前面的幾個行由NUM控制
-NUM 根-C的用法一樣的
--color[=WHEN],
--colour[=WHEN] 使用標志高亮匹配字串;
-U, --binary 使用標志高亮匹配字串;
-u, --unix-byte-offsets 當CR 字符不存在,報告字節偏移(MSDOS 模式)
常用選項及使用總結
給出測試文件test.txt
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/bin/false,aaa,bbbb,cccc,aaaaaa
DADddd:x:2:2:daemon:/sbin:/bin/false
mail:x:8:12:mail:/var/spool/mail:/bin/false
ftp:x:14:11:ftp:/home/ftp:/bin/false
&nobody:$:99:99:nobody:/:/bin/false
zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
http:x:33:33::/srv/http:/bin/false
dbus:x:81:81:System message bus:/:/bin/false
hal:x:82:82:HAL daemon:/:/bin/false
mysql:x:89:89::/var/lib/mysql:/bin/false
aaa:x:1001:1001::/home/aaa:/bin/bash
ba:x:1002:1002::/home/zhangy:/bin/bash
test:x:1003:1003::/home/test:/bin/bash
@zhangying:*:1004:1004::/home/test:/bin/bash
policykit:x:102:1005:Po
查找所有包含root的行
cat test.txt | grep root 或 grep root test.txt
輸出:
root:x:0:0:root:/root:/bin/bash
匹配以root開頭或者以zhang開頭的行,注意反斜杠
#grep方式需要使用'\'進行轉義,-e表示后面是正則表達式,默認沒有該選項
cat test.txt | grep -e '^\(root\|zhang\)'
#egrep方式-E選項直接跟正則表達式,也可以使用-F或-G選項
cat test.txt | grep -E '^(root|zhang)'
輸出:
root:x:0:0:root:/root:/bin/bash
zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
在匹配的行前面加上該行在文件中,或者輸出中所在的行號
cat test.txt | grep -n 'zhangy'
輸出:
7:zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
13:ba:x:1002:1002::/home/zhangy:/bin/bash
15:@zhangying:*:1004:1004::/home/test:/bin/bash
不匹配以root或zhang開頭的行,并顯示行號
cat test.txt | grep -nvE '^(root|zhang)'
輸出:
2:bin:x:1:1:bin:/bin:/bin/false,aaa,bbbb,cccc,aaaaaa
3:DADddd:x:2:2:daemon:/sbin:/bin/false
4:mail:x:8:12:mail:/var/spool/mail:/bin/false
5:ftp:x:14:11:ftp:/home/ftp:/bin/false
6:&nobody:$:99:99:nobody:/:/bin/false
8:http:x:33:33::/srv/http:/bin/false
9:dbus:x:81:81:System message bus:/:/bin/false
10:hal:x:82:82:HAL daemon:/:/bin/false
11:mysql:x:89:89::/var/lib/mysql:/bin/false
12:aaa:x:1001:1001::/home/aaa:/bin/bash
13:ba:x:1002:1002::/home/zhangy:/bin/bash
14:test:x:1003:1003::/home/test:/bin/bash
15:@zhangying:*:1004:1004::/home/test:/bin/bash
16:policykit:x:102:1005:Po
顯示匹配的個數,不顯示內容
#-c選項返回匹配的個數
cat test.txt | grep -c root
輸出:
3
最多只匹配i次,如果把-m i去掉的話,會有顯示所有
cat test.txt | grep -m 1 zhang
輸出:
zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
匹配時,在匹配的行前面加上文件名(通常用于多文件匹配)
cat test.txt | grep -H root
輸出:
test.txt:root:x:0:0:root:/root:/bin/bash
顯示匹配文件的文件名(通常用于多文件匹配)
cat test.txt | grep -l root
輸出:
test.txt
忽略大小寫進行匹配
cat test.txt | grep -i Root #沒有-i將匹配不到內容
輸出:
root:x:0:0:root:/root:/bin/bash
匹配整個單詞
cat test.txt | grep -w 'root'
輸出:
root:x:0:0:root:/root:/bin/bash
#如果換成 cat test.txt | grep -w 'roo' 將匹配不到內容
匹配整行 -x 選項
cat test.txt | grep -x root
輸出:
吳匹配內容
#修改命令
echo "root" | grep -x root
輸出:
root
將匹配項分別顯示(用于一行中存在多個匹配項的情況)
#不加-o選項
cat test.txt | grep root
輸出:
root:x:0:0:root:/root:/bin/bash #行內匹配項顯示在一行
#含-o選項
cat test.txt | grep -o root
輸出:
root
root
root
#一行內的匹配項分別顯示,且只顯示匹配的部分
顯示匹配行及前后i行
#顯示匹配行及其后三行
cat test.txt | grep -A 3 root
輸出:
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/bin/false,aaa,bbbb,cccc,aaaaaa
DADddd:x:2:2:daemon:/sbin:/bin/false
mail:x:8:12:mail:/var/spool/mail:/bin/false
#如果存在下面情況
cat test.txt | grep -n zhangy
輸出:
7:zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
13:ba:x:1002:1002::/home/zhangy:/bin/bash
15:@zhangying:*:1004:1004::/home/test:/bin/bash
#假設對zhangy進行匹配,顯示匹配行及后3行,將如何輸出
cat test.txt | grep -nA3 zhangy
輸出:
7:zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
8-http:x:33:33::/srv/http:/bin/false
9-dbus:x:81:81:System message bus:/:/bin/false
10-hal:x:82:82:HAL daemon:/:/bin/false
--
13:ba:x:1002:1002::/home/zhangy:/bin/bash
14-test:x:1003:1003::/home/test:/bin/bash
15:@zhangying:*:1004:1004::/home/test:/bin/bash
16-policykit:x:102:1005:Po
#重復的行將合并輸出
grep各個選項可以根據需要進行組合使用,但有時候需要注意順序,比如上面操作grep -nA3 zhangy 如果寫成grep -A3n zhangy 將會報錯,因為無法識別3n具體是多少行。或者多個選項可以通過空格+'-'進行分隔,例如grep -A3 -n zhangy 就不會報錯了。