linux 的三駕馬車grep ,sed,awk

grep

image.png

只要出現gene字眼都查找出


image.png

精確查找,一個單詞一個單詞的搜索


image.png
image.png
image.png

用于找文件前綴

到file文件里面查找關鍵詞
grep -w -f file


image.png

-n顯示行號

正則表達式


image.png
image.png
  • 只查找以“T”開頭的行


  • 模糊匹配的方法 f*ee


    image.png
  • grep 'f?ee' 其中 \是轉義符
    表示f可以出現0次或1次, 查找fee 或者ee

    • 匹配1次或多次
      grep 're+'
      表示e可以出現1次或多次,查找 ree, re, ree等
  • {n}匹配n次


    image.png
  • 列出以*結尾的文件


    image.png
  • 一般情況下*可以當做通配符

  • *表示出現0次或者1次


    image.png

sed

image.png

image.png
image.png

a命令.png

在第一行和第二行前面加一行.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

1,練習題目

image.png
image.png

從第二行開始,使用y函數,ATCG對應TAGC,如果想要保存,利用重定向命令

awk

awk定義

image.png
image.png
image.png

循環語句


image.png

image.png

先匹配外顯子的exon的行,第五列減去第四列

當用cut命令取第九列的時候,取得很多

image.png

基因前后的空格都被分割了,取出來

所以需要重新定義分隔符

-F分隔符被重新定義為制表符

打印關于UTR的所有列出來


print和print end 類似于在開頭結尾加注釋


image.png
image.png
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容