本文轉自 http://man.linuxde.net/sed
sed是一種流編輯器,它是文本處理中非常中的工具,能夠完美的配合正則表達式使用,功能不同凡響。處理時,把當前處理的行存儲在臨時緩沖區中,稱為“模式空間”(pattern space),接著用sed命令處理緩沖區中的內容,處理完成后,把緩沖區的內容送往屏幕。接著處理下一行,這樣不斷重復,直到文件末尾。文件內容并沒有 改變,除非你使用重定向存儲輸出。Sed主要用來自動編輯一個或多個文件;簡化對文件的反復操作;編寫轉換程序等。
sed處理文本時以行為單位。
sed的選項、命令、替換標記
**命令格式 **:
sed [options] 'command' file(s)
sed [options] -f scriptfile file(s)
[options]:
-e<script>或--expression=<script>: 以選項中的指定的script來處理輸入的文本文件
-f<script文件>或--file=<script文件>:以選項中指定的script文件來處理輸入的文本文件
-i :直接編輯文件
-h或--help:顯示幫助
-n或--quiet或--silent:僅顯示script處理后的結果,常與-p命令一起使用表示僅打印輸出那些進行命令操作的行
-v或--version:顯示版本信息
sed命令
a\ 在當前行下面插入文本。
i\ 在當前行上面插入文本。
c\ 把選定的行改為新的文本。
d 刪除,刪除選擇的行。
D 刪除模板塊的第一行。
s 替換指定字符
h 拷貝模板塊的內容到內存中的緩沖區。
H 追加模板塊的內容到內存中的緩沖區。
g 獲得內存緩沖區的內容,并替代當前模板塊中的文本。
G 獲得內存緩沖區的內容,并追加到當前模板塊文本的后面。
l 列表不能打印字符的清單。
n 讀取下一個輸入行,用下一個命令處理新的行而不是用第一個命令。
N 追加下一個輸入行到模板塊后面并在二者間嵌入一個新行,改變當前行號碼。
p 打印模板塊的行。
P(大寫) 打印模板塊的第一行。
q 退出Sed。
b lable 分支到腳本中帶有標記的地方,如果分支不存在則分支到腳本的末尾。
r file 從file中讀行。
t label if分支,從最后一行開始,條件一旦滿足或者T,t命令,將導致分支到帶有標號的命令處,或者到腳本的末尾。
T label 錯誤分支,從最后一行開始,一旦發生錯誤或者T,t命令,將導致分支到帶有標號的命令處,或者到腳本的末尾。
w file 寫并追加模板塊到file末尾。
W file 寫并追加模板塊的第一行到file末尾。
! 表示后面的命令對所有沒有被選定的行發生作用。
= 打印當前行號碼。
# 把注釋擴展到下一個換行符以前
sed替換標記
g 表示行內全面替換。
p 表示打印行。
w 表示把行寫入一個文件。
x 表示互換模板塊中的文本和緩沖區中的文本。
y 表示把一個字符翻譯為另外的字符(但是不用于正則表達式)。
\1 子串匹配標記 。
& 已匹配字符串標記。
sed元字符集
^ 匹配行開始,如:/^sed/匹配所有以sed開頭的行。
$ 匹配行結束,如:/sed$/匹配所有以sed結尾的行。
. 匹配一個非換行符的任意字符,如:/s.d/匹配s后接一個任意字符,最后是d。
* 匹配0個或多個字符,如:/*sed/匹配所有模板是一個或多個空格后緊跟sed的行。
[] 匹配一個指定范圍內的字符,如/[Ss]ed/匹配sed和Sed。
[^] 匹配一個不在指定范圍內的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一個字母開頭,緊跟ed的行。
\(..\) 匹配子串,保存匹配的字符,如s/\(love\)able/\1rs,loveable被替換成lovers。
& 保存搜索字符用來替換其他字符,如s/love/**&**/,love這成**love**。
\< 匹配單詞的開始,如:/\ 匹配單詞的結束,如/love\>/匹配包含以love結尾的單詞的行。
x\{m\} 重復字符x,m次,如:/0\{5\}/匹配包含5個0的行。
x\{m,\} 重復字符x,至少m次,如:/0\{5,\}/匹配至少有5個0的行。
x\{m,n\} 重復字符x,至少m次,不多于n次,如:/0\{5,10\}/匹配5~10個0的行。
sed用法實例
1. 替換操作:s命令
sed 's/book/books/' file # 將file文件中每一行的第一個book替換為books
2. 全面替換標記g
sed 's/book/books/g' file # 替換file文件每一行中的所有匹配
# 當需要從第N處匹配開始替換時,可以使用/Ng
sed 's/book/books/2g' file # 從file每一行第二個匹配的開始替換
3. 定界符
以上命令中字符 / 在sed中作為定界符使用,也可以使用其他的任意定界符:
sed 's:test:TEXT:g' file # 以:作為定界符
sed 's|test|TEXT|g' file # 以|作為定界符
# 定界符出現在式樣內部時,需要進行轉義
sed 's/\/bin\/bash/bin/g' file # 將/bin/bash替換為bin
4. 刪除操作:d命令
sed '/^$/d' file # 刪除空白行
sed '2d' file # 刪除第二行
sed '$d' file # 刪除最后一行
sed '2,$d' file # 刪除第二行到最后一行
sed '/^test/d' # 刪除所有以test開頭的行
5. 已匹配字符串標記&
正則表達式\w\+匹配到的每一個單詞,使用[&]替換他,&對應于之前匹配到的單詞
echo this is a test line | sed 's/\w\+/[&]/g'
[this] [is] [a] [test] [line]
# 所有以192.168.01開頭的行都會被替換成自己加上localhost:
sed 's/^192.168.01/&localhost/' file
192.168.01localhost
6. 子串匹配標記\1
匹配給定樣式其中的一部分
echo this is digit 7 number | sed 's/digit \([0-9]\)/\1/'
this is 7 number
# 命令中digit 7 被替換成了7。樣式匹配到的子串是7,\(\)用于匹配子串,
# 對于匹配到的子串第一個就標記為\1,以此類推,匹配到的第二個子串是\2
echo aaa bbb | sed 's/\([a-z]\+\) \([a-z]\+\)/\2 \1/'
bbb aaa
sed -n 's/\(love\)able/\1rs/p' file # 將file中的loveable替換為lovers,并打印出來
lovers
7. 組合多個表達式
sed '表達式' | sed '表達式' <==> sed '表達式;表達式'
8. 引用
sed 表達式可以使用單引號來引用,但是如果表達式內部包含變量字符串,就需要使用雙引號
test=hello
echo hello WORLD | sed "s/$test/HELLO/"
HELLO WORLD
9. 選定行的范圍:,(逗號)
# 所有在模板test和check所確定的范圍內的行都被打印
sed -n '/test/,/check/p' file
# 打印第五行開始到第一個包含以test開頭的行之間的所有行
sed -n '5,/^test/p' file
# 對于模板test和west之間的行,每行的末尾用字符aaa bbb替換
sed '/test/,/west/s/$/aaa bbb/' file
10. 多點編輯:e命令
-e選項允許在同一行里執行多條命令
sed -e '1,5d' -e 's/test/check/' file
# 第一條命令刪除1至5行,第二條命令用check替換test。
# 命令執行順序對結果有影響,如果兩個都是替換命令那么第一個替換命令將影響第二個替換命令的結果
11. 從文件讀入:r命令
# file里的內容被讀進來,顯示在與test匹配的行后面,如果匹配多行,則file的內容將顯示在所有匹配行的下面
sed '/test/r file' filename
寫入文件:w命令
# 在example中所有包含test的行都被寫入file里
sed -n '/test/w file' example
12. 追加(行下):a\命令
# 將this is a test line追加到以test開頭的行的后面
sed '/^test/a\this is a test line' file
# 在test.conf文件第二行之后插入this is a test line
sed -i '2a\this is a test line' file
13. 插入(行上):i\命令
# 將this is a test line 插入到以test開頭的行的前面
sed '/^test/i\this is a test line' file
# 在第五行之前插入this is a test line
sed '5i\this is a test line' file
14. 下一個:n命令
# 如果test被匹配,則移動到匹配行的下一行,替換這一行的aa,變為bb,并打印該行
sed '/test/{ n; s/aa/bb/; }' file
15. 變形:y命令
# 把1-10行內所有的abcde轉變為大寫,注意,正則表達式元字符不能使用這個命令
sed '1,10y/abcde/ABCDE/' file
16. 退出:q命令
sed '10q' file # 打印完第十行后,退出sed
17. 保持和獲取:h命令和G命令
在sed處理文件的時候,每一行都被保存在一個叫模式空間的臨時緩沖區中,除非行被刪除或者輸出被取消,否則所有被處理的行都將 打印在屏幕上。接著模式空間被清空,并存入新的一行等待處理
sed -e '/test/h' -e '$G' file
# 在這個例子里,匹配test的行被找到后,將存入模式空間,h命令將其復制并存入一個稱為保持緩存區的特殊緩沖區內。
# 第二條語句的意思是,當到達最后一行后,G命令取出保持緩沖區的行,然后把它放回模式空間中,且追加到現在已經存在于模式空間中的行的末尾。
# 在這個例子中就是追加到最后一行。簡單來說,任何包含test的行都被復制并追加到該文件的末尾。
18. 保持和互換:h命令和x命令
互換模式空間和保持緩沖區的內容。
sed -e 'test/h' -e '/check/x' file # 把包含test與check的行互換
19. 腳本scriptfile
sed腳本是一個sed的命令清單,啟動Sed時以-f選項引導腳本文件名。Sed對于腳本中輸入的命令非常挑剔,在命令的末尾不能有任何空白或文本,如果在一行中有多個命令,要用分號分隔。以#開頭的行為注釋行,且不能跨行。
sed [options] -f scriptfile file
20. 打印奇數或偶數行
方法1:
sed -n 'p;n' test # 奇數行
sed -n 'n;p' test # 偶數行
方法2:
sed -n '1~2p' test # 奇數行
sed -n '2~2p' test # 偶數行
21. 打印匹配字符串的下一行
grep -A 1 SCC URFILE
sed -n '/SCC/{n;p}' URFILE
awk '/SCC/{getline;print}' URFILE