在Unix下一次性操作多個文件時,命令行提供通配符(wildcards),短文本模式(通常只有一個字符),可以與文件路徑中的另一個字符(或多個字符)匹配,這種快捷方式使得可用簡潔的模式來代表一組文件或者指定一整套相關的文件路徑名。
使用通配符模式,您可以使用單個命令輕松地列出、查看、復制、移動或刪除大量文件。通配符比正則表達式早出現,可以看作是原始的正則表達式,功能沒有正則強大靈活,但勝在簡單和方便。
下面介紹Unix中Bash的各種通配符。
? 字符
?字符代表單個字符。
# 存在文件 1.txt 2.txt 和 13.txt
$ ls ?.txt
1.txt 2.txt
上面命令中,?表示單個字符,所以會同時匹配1.txt和2.txt。如果匹配多個字符,就需要多個?連用。
# 存在文件 1.txt、2.txt 和 13.txt
$ ls ??.txt
13.txt
上面命令中,??
表明匹配兩個字符。注意,?
不能匹配空字符,也就是說,它占據的位置必須有字符存在。
* 字符
*
可以代表任意數量的字符。
# 存在文件 1.txt、2.txt 和 13.txt
$ ls *.txt
1.txt 2.txt 13.txt
# 輸出所有文件
$ ls *
1.txt 2.txt 13.txt
上面代碼中,*
可以匹配任意長度的字符,另外*
也可以匹配空字符。
# 存在文件 1.txt、2.txt 和 13.txt
$ ls 1*.txt
1.txt 13.txt
[...] 模式
[...]
表示匹配方括號之中的任意一個字符,比如[13679]
可以匹配五個數字,或者[aeiou]可以匹配五個元音字母。
# 存在文件 1.txt 2.txt 12.txt 和 13.txt
# 存在文件 a.txt e.txt u.txt 和 ae.txt
$ ls [12].txt
1.txt 2.txt
$ ls [ae].txt
a.txt e.txt
$ ls *[12].txt
12.txt 1.txt 2.txt
$ ls *[ae].txt
a.txt ae.txt e.txt
[start-end]
表示一個連續的范圍,[0-9]代表0-9這10個數字,[a-z]代表a-z這26個字母。
# 存在文件 a.txt e.txt u.txt 和 ae.txt
$ ls [a-z].txt
a.txt c.txt u.txt
# 存在文件 report1.txt、report2.txt、report3.txt 和 report13.txt
$ ls report[0-9].txt
report1.txt report2.txt report3.txt
[^...]
和 [!...]
[^...]
和[!...]
表示匹配不在方括號里面的字符(注意不包括空字符),這里兩種寫法是等同的。
# 存在文件 1.txt 2.txt 3.txt 和 13.txt
$ ls [^1].txt
2.txt 3.txt
$ ls [!1].txt
2.txt 3.txt
上面代碼中,[!1]
和 [^1]
表示要排除文件名中包含1的名字。
這種模式下也可以使用連續范圍的寫法[!start-end]
和 [^start-end]
。
# 存在文件 report1.txt report2.txt report3.txt report4.txt report5.txt 和 report13.txt
$ echo report[!1-3].txt
report4.txt report5.txt
$ echo report[^1-3].txt
report4.txt report5.txt
上面代碼中,[!1-3]
和 [^1-3]
表示要排除文件名中包含1、2和3的名字。
{...} 模式
{...}
表示可以匹配大括號里面的所有模式,多個模式之間可以使用逗號分隔用于匹配。
# 存在文件 dag deg dig dug dog ddg 和 dgg,不存在 dtg
$ echo d{a,e,i,u,o,t}g
dag deg dig dug dog dtg
$ ls d{a,e,i,u,o,t}g
ls: cannot access dtg: No such file or directory
dag deg dig dog dug
這個模式也可以用于多字符的模式。
# 存在文件 cat dog pig,不存在tiger
$ echo {cat,dog,pig,tiger}
cat dog pig tiger
$ ls {cat,dog,pig,tiger}
ls: cannot access tiger: No such file or directory
cat dog pig
請注意,當使用echo
的命令的時候,{...}
與[...]
有一個很重要的區別。如果匹配的文件不存在,[...]
會失去模式的功能,變成一個單純的字符串,而{...}
依然可以展開。但是如果使用ls
的命令時,結果如下:
# 不存在 a.txt 和 b.txt
$ ls [ab].txt
ls: cannot access [ab].txt: No such file or directory
$ echo [ab].txt
[ab].txt
$ ls {a,b}.txt
ls: cannot access a.txt: No such file or directory
ls: cannot access b.txt: No such file or directory
$ echo {a,b}.txt
a.txt b.txt
上面代碼中,如果不存在a.txt
和b.txt
,那么[ab].txt
就會變成一個普通的文件名,而{a,b}.txt
可以照樣展開。
另外,改模式下的大括號可以嵌套。
$ echo {j{p,p{a,e}}g,p{n,m}g,bmp}
jpg jpag jpeg png pmg bmp
與此同時,大括號也可以與其他模式聯用。
# 存在文件 cat dag deg dig dug dog dtg
$ echo {cat,d*}
cat dag deg dig dog dtg dug
# 不存在文件 cat dag deg dig dug dog dtg
$ echo {cat*,d*}
cat* d*
# 存在文件 cat,不存在dag deg dig dug dog dtg
$ echo {cat*,d*}
cat d*
上面代碼中,會先進行大括號擴展,然后進行*
擴展。擴展時,會先進行判斷文件是否存在,當文件不存在的情況下,會變成字符輸出。
{start..end} 模式
{start..end}
會匹配指定的連續范圍的字符。
$ echo d{a..f}g
dag dbg dcg ddg deg dfg
$ echo {0..12}
0 1 2 3 4 5 6 7 8 9 10 11 12
如果遇到無法解釋的擴展,模式會原樣輸出。
$ echo d{a1..a12}g d{a1..f12}g
d{a1..a12}g d{a1..f12}g
當這種模式與逗號一起使用,就可以寫出復雜的模式。
$ echo .{mp{3..4},m{4..5}{a,b,p,v}}
.mp3 .mp4 .m4a .m4b .m4p .m4v .m5a .m5b .m5p .m5v
注意事項
1、任何通配符都是先解釋(或者說是擴展),再執行命令;
# 存在文件 1.txt、2.txt 和 13.txt
$ ls 1*.txt
1.txt 13.txt
此處是先將1*.txt
擴展成1.txt
和13.txt
,然后執行命令ls 1.txt 13.txt
。
這是因為Bash 接收到命令以后,當發現命令中包含有通配符時,會首先進行通配符擴展,然后再執行命令。
2、書寫的通配符不匹配時,會當成字符串原樣輸出;
# 不存在 ac 開頭的文件名
$ echo ac*
ac*
$ ls ac*.txt
ls: cannot access ac*.txt: No such file or directory
這里的原因時Bash 在擴展通配符的時候,當發現不存在匹配的文件,會將通配符原樣輸出。
但是對于echo
的命令時,{...}
不適用這個規則。
3、通配符的使用只適用于單層路徑;
上述的所有通配符都只能匹配單層文件路徑,不能跨目錄進行文件匹配,也可以認為通配符無法匹配子目錄里面的文件。這是因為?
或*
這樣的通配符,不能匹配路徑分隔符(/)。
如果要匹配多層子目錄里面的文件,應該寫成下面這樣。
$ ls */*/*.txt
# 要匹配n層子目錄,就使用(n+1)個 *
4、通配符可用作文件名使用;
Unix下允許使用通配符?
*
做文件名,建議如果要使用這樣的文件名時,請把文件名放入單或雙引號或者\
進行反義里面,避免引人誤解。
$ touch 'aaab?' "aaaab?" aab\? aaac* adddd?
$ ls
aaaab? aaab? aaac* aab? adddd?
$ rm 'aaab?' "aaaab?" aab\? aaac* adddd?
$ ls -lthr --color=tty
total 0
References
Think You Understand Wildcards? Think Again
Advanced Wildcard Patterns Most People Don't Know
—— dulunar 后記于 2020.12