https://www.biostars.org/p/302465/
https://www.biostars.org/p/297272/
啊啊啊啊啊啊?
選取唯一比對的序列uniqe read
nohup ls *sam | while read id; do samtools view -S -F 4 $id | grep -v "XS:" >${id%%%_*}.sam; done &
比對到miRNA base 上的reads 數目的統計,沒有好辦法
我的理解是統計比對上的reads 的個數
所以,我做的是,統計sam 文件第三列,“比對的小RNA的名字”出現的個數。
ls *sam | while read id; do awk -F '\t' '{sum[$3]++}END{for(i in sum) print i "\t" sum[i]}' $id > ${id%%%.*}.counts; done &
出來的txt 文件類似于這樣:
補充:我不知道為啥,我的sam 文件除了頭部之外的列也以@開頭,所以后面的流程就沒辦法進行。解決辦法:
nohup ls *.sam | while read id; do sed -i "s/@HISEQ/HISEQ/g" $id; done &
得到的counts 文件合并
paste *mature.bna*counts > mature.bna.merge.counts