寫在前面 進行這部分重復序列提取和注釋,主要是為了屏蔽基因組的重復序列,以保證后面基因結構注釋的準確性。大致的流程如下:1.首先使用Repeat...
雖然前期陸陸續續間斷學習用過R,當時感覺自己現在每次用R又要花很多時間重新理解R的語言邏輯,所以想系統學習下R語言,主要記錄下自己的R的學習過程...
寫在前面 性別被稱為“進化生物學問題的皇后”,一直是生命科學領域中最具吸引力和最熱門研究方向之一。而有性生物其性染色體的解析是性別研究的基礎,這...
寫在前面 基因組組裝完成后,我們需要對我們組裝好的基因組進行一個質量評估,質量評估主要從連續性(continuity),完整性(complete...
寫在前面 初始組裝經過基因組糾錯(polish)以及去冗余(purge)之后,就可以將其掛載到染色體上,使其由contig/scaffold級別...
基于三代測序reads進行Scaffold構建以及補洞gap filling,我這里只有一種三代測序數據CLR,這里就先不做了,而且我看文章做這...
寫在前面 在進行染色體掛載之前一般對得到的 "primary assembly"(主要組裝/初始組裝結果)進行進一步的優化,以減少錯誤,提高基因...
寫在前面 冗余序列的產生和多種因素有關,如 CLR 的測序錯誤,基因組自身的雜合性和重復序列的影響等等,purge_dups軟件能根據read深...
寫在前面 前面兩篇文章De novo組裝#01 | 測序數據質控(fasqc+fastp)[http://www.lxweimin.com/p/...