LTR組裝指數(LAI)評估基因組

基因組組裝完成后,可通過查看contig的N50或者BUSCO,以及LAI評估組裝質量。本文就LAI方法做一簡單介紹。

基因組中的重復序列大體分為兩類:

  • 串聯重復(Tandem repeats)(TRF可預測)
  • 散在重復(Dispersed repeats)

其中串聯重復含有:簡單重復序列,衛星序列等;
散在重復包括:轉座子(TE,transposons,elements)

TE又可細分為兩類:

  • DNA transposons: 由DNA介導
  • RNA transposons: 由RNA介導,通過RNA的反轉錄獲得DNA,從而轉移到其他基因組位置。

目前主要存在兩種類型的RNA轉座子:

  • 1 LTR (long terminal repeats)雙末端都是長的重復序列
  • 2 non-LTR TEs,雙末端缺乏重復序列。 LINE1和SINE(short interspersed transposable element)長/短穿插轉座元件

結構如下(來源http://www.lxweimin.com/p/7d794d22e0a0

LTR Assembly Index (LAI) ,LAI指數就是完整LTR反轉座子序列占總LTR序列長度的比值。在基因組組裝過程中,LTR較為難組裝,因此被用來檢測組裝質量。

軟件安裝

上述軟件自行下載,或者使用conda進行安裝即可

安裝LTR_retriever

git clone https://github.com/oushujun/LTR_retriever.git

進入paths文件,修改各個軟件所在路徑

BLAST+=/data/pub/liuzy/software/ncbi-blast-2.8.1+/bin/  #a path that contains makeblastdb, blastn, blastx
RepeatMasker=/data/pub/liuzy/software/repeatmask/RepeatMasker/RepeatMasker      #a path that contains RepeatMasker
HMMER=/usr/local/bin/           #a path that contains hmmsearch
CDHIT=/data/pub/liuzy/software/cdhit-4.8.1

安裝LRT_finder

git clone https://github.com/xzhub/LTR_Finder.git
cd LTR_Finder/source/
make

簡單使用

LTR_finder 鑒定LTR序列
~/software/LTR_Finder/source/ltr_finder   ../groups.asm.fasta > groups.asm.finder.scn

這里的-D表示5'和3'LTR之間的最大距離,-d表示5'和3'LTR之間的最小距離,-L表示5'和3'LTR序列的最大長度,-l表示5'和3'LTR序列的最小長度,-p表示完全匹配配對的最小長度,-C表示檢測中心粒(centriole)刪除高度重復區域,-M表示最小的LTR相似度。如果不怎么該怎么設置就用默認值。

LTR_retriever根據LTR_FINDER的輸出識別LTR-RT,生成非冗余LTR-RT文庫,可用于基因組注釋
/data/pub/liuzy/software/LTR_retriever/LTR_retriever -threads 4 -genome groups.asm.fasta -infinder groups.asm.finder.scn

這里的-infinder表示輸入來自于LTR_FINDER,它支持同時輸入LTRharvest的輸出(-inharvest)和 MGEScan-LTR 的輸出(-inmgescan). 嫌速度太慢,可以用-threads增加線程數

計算LAI值
/opt/biosoft/LTR_retriever/LAI -t 10 -genome groups.asm.fasta -intact groups.asm.fasta.pass.list -all groups.asm.fasta .out

結果文件Athaliana.fa.out.LAI,第二行最后一個值就是LAI值

LAI值的評估標準

Category    LAI Examples
Draft   0 ≤ LAI < 10    Apple (v1.0), Cacao (v1.0)
Reference   10 ≤ LAI < 20   Arabidopsis (TAIR10), Grape (12X)
Gold    20 ≤ LAI    Rice (MSUv7), Maize (B73 v4)

參考

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,885評論 6 541
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,312評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,993評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,667評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,410評論 6 411
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,778評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,775評論 3 446
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,955評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,521評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,266評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,468評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,998評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,696評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,095評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,385評論 1 294
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,193評論 3 398
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,431評論 2 378