【豆科基因組】綠豆Mungbean, Vigna radiata蘇綠基因組預印

一、來源

High-quality genome assembly, annotation and evolutionary analysis of the mungbean (Vigna radiata) genome. November 2020.
DOI:10.22541/au.160587196.63922177/v1

單位:江蘇農(nóng)科院

主要結(jié)果:

  • 通過Nanopore+Illumina+HiC組裝蘇綠基因組,組裝大小473.67,contig N50=11.3Mb,scaffold N50=42.4。
  • 52.8%的重復序列,LTRs占33.9%。
  • 預測了33924個基因,95.7%注釋率。
  • 綠豆與其關(guān)系最近的小豆分化時間約11.66萬年前,綠豆特有基因家族277個,其中18個正選擇基因。

綠豆研究進展:

  • 中綠VC1973A基因組草圖
  • 葉發(fā)育
  • 白粉病抗性powdery mildew resistance
  • 豆象抗性bruchid resistance
  • 耐鹽 salinity tolerance
  • 基因組多樣性和GWAS(GBS),種皮光澤

二、結(jié)果

測序組裝

蘇綠一號,測序約122.9Gb數(shù)據(jù),深度259.5X,其中Oxford Nanopore (142.4X)。
組裝先使用canu糾正reads,再用wtdbg2組裝。原始組裝結(jié)果用Racon對nanopore reads 進行三輪糾錯,使用Pilon利用二代測序數(shù)據(jù)進行3輪糾錯。組裝大小473.67 Mb,359 contigs, N50 =11.32 Mb。
HiC-Pro利用唯一比對reads鑒定有效和無效互作,使用LACHESIS進行聚類、排序和定向,最后掛載11條染色體。基因組大小470.45Mb(掛載率99.32%,組裝率87.8%)。


image.png
image.png

a-e 代表 the distribution of FPKM, gene density, density of Copia
retrotransposable elements, density of Gypsy retrotransposable elements and GC density, respectively, with
densities calculated in 200-kb windows.
f 代表 syntenic blocks.

組裝評價

三方面評估:

  • 組裝連續(xù)性和覆蓋度。二代測序reads比對99.07%;CEGMA評估連續(xù)性449個(98.03%)核心保守基因。
  • 完整性。BUSCO評估,92.43%。
  • HiC聚類熱圖。

編碼基因預測

三個來源:

  • ab initio :Genscan, Augustus (v2.4), GlimmerHMM (v3.0.4), GeneID (v1.4) and SNAP
  • homology-based:GeMoMa (v1.3.1)
  • unigene-based prediction :Hisat (v2.0.4) and
    Stringtie (v1.2.3), and PASA (v2.0.2)組裝,TransDecoder (v2.0) and GeneMarkST(v5.1)預測。

EVM整合,PASA優(yōu)化。共預測33,924個蛋白編碼基因,20,446個三種證據(jù)都有。

基因功能注釋

BLAST (v2.2.31) against NR, KOG,
GO, KEGG and TrEMBL database, performed KEGG pathway。
共32,470個基因注釋(95.71%)。
InterProScan(包括Prosite, PRINTS, PFAM, ProDom, Smart, TIGRFAMs, SignlP, Trans memberane等)進行motif注釋,共注釋2,765 motifs and 35,154 domains。

非編碼RNA注釋

microRNA, rRNA使用Rfam數(shù)據(jù)庫;
tRNA使用tRNAscan-SE。
最后鑒定86 miRNA, 352 rRNA and 653 tRNA belonging to 23, 4 and 22 families respectively。

假基因預測

假基因序列與功能基因類似,但由于突變丟失了功能。
使用BLAT將預測蛋白序列尋找可能的同源基因序列,再用GeneWise尋找不成熟的終止密碼和基因序列上的移碼突變,從而獲得假基因,共4320個,平均長度2237bp。

重復序列注釋

使用Repbase庫和從頭預測的重復庫(采用LTR FINDER和RepeatModeler),數(shù)據(jù)庫鑒定采用PASTEClassier,合并以上兩個重復庫作為最終庫。RepeatMasker注釋。共52.83%,重復元件長度46.4 Kb - 215.1 Mb。大部分是LTR(33.92%),包括56.6% Gypsy LTRs, 39.77% Copia LTRs and 3.63% other types of LTRs。

使用MISA檢測簡單串聯(lián)重復(SSRs),共224,409 SSRs (136,045 mono-, 56,033 di-, 28,959
tri-, 1,977 tetra-, 1,098 penta-, and 297 hexa-nucleotide repeats)。全長3,252,656 bp(~0.69%)

進化分析和分歧時間估計

從綠豆和10個近緣物種(Vigna radiata , cowpea, common bean, soybean, Vigna angularis , Lablab purpureus ,Medicago
truncatula , Lotus japonicus , Vigna subterranea and Arabidopsis thaliana)中OrthoMCL軟件鑒定單拷貝直系同源基因,基于該數(shù)據(jù)集采用MUSCLE+MEGA+PHYML構(gòu)樹。

使用Mcmctree通過最大似然樹估計分歧時間,并用化石證據(jù)矯正。


image.png
image.png

全基因組復制

為研究綠豆進化,將之與其他4種雙子葉植物(Vigna radiata, Arabidopsis thaliana(Arabidopsis)比較,基于兩物種間或物種內(nèi)的成對同源基因計算4DTv (4-fold degenerate synonymous sites of the third codons)。

Vigna radiata vs Arabidopsis thaliana有分化峰值,Vigna radiata vs common bean存在低峰。表明綠豆和擬南芥分化的時間比綠豆和普通豆(菜豆)分化更早。


image.png

LTR插入時間估計

采用突變率來估計LTR插入時間。蘇綠中的LTR插入事件不是很活躍。


image.png

正選擇基因

通過評估單拷貝基因的Ka/Ks來檢測正選擇基因。共檢測到18個基因。GO富集在membrane-enclosed lumen 和cell junction。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,327評論 6 537
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,996評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,316評論 0 382
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,406評論 1 316
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,128評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,524評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,576評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,759評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,310評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 41,065評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,249評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,821評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,479評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,909評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,140評論 1 290
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,984評論 3 395
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,228評論 2 375

推薦閱讀更多精彩內(nèi)容