序列比對軟件 MUMmer 結果文件解讀(三)

該系列主要介紹了 MUMmer 軟件下核苷酸序列比對程序 nucmer 的使用,計算操作見前兩篇推文;

序列比對軟件 MUMmer 快速上手(一)

序列比對軟件 MUMmer 高級使用(二)

這一塊主要解釋一下比對的結果文件 <prefix>.delta 如何解讀;

delta file 表示 NUCmer pipeline 下所有 alignment 的編碼表示,該軟件還設計了一系列程序,通過以 <prefix>.delta 文件作為輸入,從而輸出一些可讀的結果。

delta file 主要包含每個 alignment 的坐標,并強調這些 alignments 中包含的 insertions 或 deletions 之間的距離;

以下圖為示例,簡單解釋一下每一行的內容:

示例 <prefix>.delta 文件內容

第一行:展示了 query 和 reference 基因組文件的位置,這里我隱去了;

第二行:指定了 alignment 數據類型,即 "NUCMER" 或 "PROMER";

第三行:4 個詞分別代表 ref 的 fastaID,qry 的 fastaID,ref 序列長度,qry 序列長度;

第四行:第一組 alignment 結果,指定兩個對齊序列,后續每一組對齊都有這么一個 header,并描述對齊的坐標和一些錯誤信息;如果起始坐標大于結束坐標,則表明對齊是在反鏈上;前 4 個值分別表示 reference 中的起點和終點,以及 query 中的起點和終點;后 3 個值分別表示錯誤數(non-identities + indels),相似錯誤(non-positive match scores),終止密碼子(NUCMER為0);

第五行始:每一個數字表示一個插入或確實,正值 query 相較于 reference 存在缺失,負值表示插入,0 表示該組 alignment 結束;數字坐標疊加表示,比如:上圖中 query?第一個缺失的位置為 32,第二個缺失的位置為 32+27,第三個缺失的位置為 32+27+1,以此類推;

但是,在實際應用在,該結果需要進一步處理才能生成更加可讀的結果,下一篇就介紹一下?delta-filter、mapview、mummerplot、show-aligns、show-coords、show-snps 等操作。

序列比對軟件 MUMmer 結果可讀化處理(四)

要是覺得有用可以登錄一下賬號,點個贊,以表支持!

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容