該系列主要介紹了 MUMmer 軟件下核苷酸序列比對程序 nucmer 的使用,計算操作見前兩篇推文;
這一塊主要解釋一下比對的結果文件 <prefix>.delta 如何解讀;
delta file 表示 NUCmer pipeline 下所有 alignment 的編碼表示,該軟件還設計了一系列程序,通過以 <prefix>.delta 文件作為輸入,從而輸出一些可讀的結果。
delta file 主要包含每個 alignment 的坐標,并強調這些 alignments 中包含的 insertions 或 deletions 之間的距離;
以下圖為示例,簡單解釋一下每一行的內容:
第一行:展示了 query 和 reference 基因組文件的位置,這里我隱去了;
第二行:指定了 alignment 數據類型,即 "NUCMER" 或 "PROMER";
第三行:4 個詞分別代表 ref 的 fastaID,qry 的 fastaID,ref 序列長度,qry 序列長度;
第四行:第一組 alignment 結果,指定兩個對齊序列,后續每一組對齊都有這么一個 header,并描述對齊的坐標和一些錯誤信息;如果起始坐標大于結束坐標,則表明對齊是在反鏈上;前 4 個值分別表示 reference 中的起點和終點,以及 query 中的起點和終點;后 3 個值分別表示錯誤數(non-identities + indels),相似錯誤(non-positive match scores),終止密碼子(NUCMER為0);
第五行始:每一個數字表示一個插入或確實,正值 query 相較于 reference 存在缺失,負值表示插入,0 表示該組 alignment 結束;數字坐標疊加表示,比如:上圖中 query?第一個缺失的位置為 32,第二個缺失的位置為 32+27,第三個缺失的位置為 32+27+1,以此類推;
但是,在實際應用在,該結果需要進一步處理才能生成更加可讀的結果,下一篇就介紹一下?delta-filter、mapview、mummerplot、show-aligns、show-coords、show-snps 等操作。
要是覺得有用可以登錄一下賬號,點個贊,以表支持!