基因組文章 | 2022《Nature Genetics 》六倍體栽培燕麥的起源與進(jìn)化

燕麥Avena sativa)作為谷物中最好的全價(jià)營(yíng)養(yǎng)食品,因其富含蛋白質(zhì)、不飽和脂肪酸以及可溶性膳食纖維而廣受消費(fèi)者青睞。同時(shí),栽培燕麥?zhǔn)橇扼w作物,它在生物量、活力和對(duì)環(huán)境變化的適應(yīng)性方面均具有多倍體植物的顯著優(yōu)勢(shì),在應(yīng)對(duì)糧食安全挑戰(zhàn)中可以發(fā)揮其獨(dú)特作用。

北京時(shí)間2022年7月18日晚23時(shí),國(guó)家燕麥?zhǔn)w麥產(chǎn)業(yè)技術(shù)體系首席科學(xué)家任長(zhǎng)忠研究員領(lǐng)銜的以四川農(nóng)業(yè)大學(xué)和吉林省白城市農(nóng)業(yè)科學(xué)院為核心的燕麥研究團(tuán)隊(duì)在 Nature Genetics 上發(fā)表了題為 Reference genome assemblies reveal the origin and evolution of allohexaploid oat 的研究論文。該研究發(fā)布了栽培六倍體裸燕麥及其二倍體和四倍體祖先的參考基因組,并進(jìn)一步選擇能代表燕麥屬現(xiàn)存所有基因組類型的二倍體、四倍體和六倍體材料結(jié)合全基因測(cè)序、葉綠體基因組和轉(zhuǎn)錄組分析,深入探究六倍體燕麥的起源與亞基因組進(jìn)化。

一、組裝

燕麥 (Avena sativa L., 2n = 6x = 42, AACCDD 基因組) 作為重要的糧飼兼用型作物,由于其基因組為異源六倍體組成,基因組大(~11G)、重復(fù)序列含量高(~87%)且亞基因組間存在大量的交換,導(dǎo)致其基因組組裝難度較大,相關(guān)研究一直滯后。研究團(tuán)隊(duì)利用近20年的燕麥屬物種研究經(jīng)驗(yàn),針對(duì)六倍體燕麥亞基因組構(gòu)成及其在基因組組裝中可能遇到的問題,設(shè)計(jì)了利用 ultra-long三代測(cè)序結(jié)合HiC、二代測(cè)序、Iso-seq和RNA-seq,并同時(shí)組裝栽培燕麥最可能的四倍體和二倍體祖先的策略。

項(xiàng)目組首先選擇來自裸燕麥起源中心的傳統(tǒng)地方品種“三分三”為材料,基于1028Gb的三代超長(zhǎng)序列,并使用650 Gb的二代數(shù)據(jù)進(jìn)行校正,組裝了10.76 Gb的燕麥基因組,基于1296 Gb的Hi-C數(shù)據(jù)將99.06%的基因組序列掛載到燕麥21條染色體上(表1)。基因組組裝從contig N50(75.27Mb),LAI(18.34)、BUSCO(99.44%)以及與來自六倍體燕麥一致性圖譜標(biāo)記的共線性等多方面進(jìn)行質(zhì)量評(píng)估,均顯示了所組裝基因組的高質(zhì)量。

為了準(zhǔn)確區(qū)分亞基因組并闡明六倍體燕麥的多倍化歷史,該研究對(duì)其最可能的祖先物種 A. longiglumis(2n=2x=14,AlAl 基因組)和 A. insularis(2n=4x=28,CCDD 基因組)同時(shí)進(jìn)行了測(cè)序和組裝,分別構(gòu)建了3.74 Gb和7.52 Gb的二倍體和四倍體參考基因組。基于這三個(gè)物種染色體之間的相似性,研究人員明確了六倍體燕麥21條染色體的A、C和D亞基因組歸屬,完成了六倍體的染色體組裝、掛載和注釋,獲得了燕麥染色體級(jí)別的高質(zhì)量參考基因組(圖1)。

圖1 AlAl基因組二倍體、CCDD基因組四倍體和AACCDD六倍體栽培燕麥的基因組

a, A和D基因組染色體著絲粒位置;
b, C基因組特異性重復(fù)序列Am1在染色體上的分布。其中,三分三的的1A、2D、3D、4D和5D染色體上富含Am1的區(qū)域是C基因組滲入;
c, A基因組特異性重復(fù)序列As120a在染色體的分布;
d,k-mer頻率;
e,串聯(lián)重復(fù)(TR)密度;
f, LTR密度;
g,基因密度;
h,染色體名稱和大小。
最內(nèi)層顯示六倍體及其祖先物種的共線性,上層的彩色表示每個(gè)六倍體染色體及其祖先染色體的共線性,灰色的下層顯示六倍化后的染色體重排。

二、進(jìn)化分析

為進(jìn)一步闡明燕麥在禾本科谷類作物中的進(jìn)化地位,該研究進(jìn)行了主要禾谷類作物的系統(tǒng)進(jìn)化基因組學(xué)分析。通過鑒定到的2237個(gè)同源單拷貝核基因?qū)ρ帑溂捌湎嚓P(guān)禾谷類作物的系統(tǒng)分析結(jié)果表明:燕麥族和小麥族之間的分化發(fā)生在稻族形成之后,且燕麥族與多花黑麥草的親緣關(guān)系比與小麥族更近

通過與以水稻為代表的祖先核型和普通小麥的三個(gè)亞基因組進(jìn)行比較,明確燕麥不同亞基因組的核型進(jìn)化歷史并發(fā)現(xiàn)在燕麥中存在大量染色體重排(圖2)。

圖2 禾谷物作物的系統(tǒng)基因組關(guān)系

a,燕麥及其相關(guān)禾谷類作物系統(tǒng)發(fā)育和分化時(shí)間;
b,燕麥族、多花黑麥草和小麥族中共享和獨(dú)特基因家族的數(shù)量韋恩圖;
c,燕麥和小麥可能的染色體進(jìn)化核型模式。亞基因組染色體不同的顏色顯示其來源于水稻不同的染色體(Os1–Os12)片段,水稻染色體可以作為祖先染色體核型(AGK1–AGK12)的代表;
d,燕麥和小麥三個(gè)亞基因組之間的染色體共線性;

三、起源分析

選擇能代表燕麥屬所有基因組亞型和不同倍性水平的物種進(jìn)行基于全基因組重測(cè)序、轉(zhuǎn)錄組測(cè)序和葉綠體基因組的系統(tǒng)發(fā)育分析,結(jié)果一致表明Al/As基因組二倍體以及四倍體A. insularis 的C和D亞基因組分別與六倍體燕麥的A、C和D亞基因組具有最高的相似性,且通過葉綠體基因組確定D基因組是六倍體燕麥的母本供體,而 C基因組二倍體作為栽培燕麥的父本基因組,通常比母系起源的基因組更容易發(fā)生染色體變異,與本研究中燕麥C基因組二倍體和多倍體物種的C亞基因組間相對(duì)較低的共線性一致。由此,該研究明確了栽培燕麥的多倍化歷史并提出了燕麥屬物種的網(wǎng)狀進(jìn)化模式。現(xiàn)有的ACD基因組六倍體栽培燕麥?zhǔn)且訟l/As基因組二倍體祖先為父本,和CD-基因組四倍體A.insularis為母本雜交加倍后形成的(圖3)。

圖3 六倍體燕麥的網(wǎng)狀進(jìn)化模式圖

四、燕麥屬物種多倍化過程中的染色體結(jié)構(gòu)變異

為了研究燕麥多倍化過程中發(fā)生的染色體結(jié)構(gòu)變異,研究人員對(duì)二倍體、四倍體和六倍體物種進(jìn)行了共線性分析。結(jié)果表明,在燕麥多倍化過程中發(fā)生了多次大的易位和倒位事件,該研究通過熒光原位雜交證實(shí)了這些染色體結(jié)構(gòu)變異(圖4)。

此外,在燕麥四倍體中主要是非同源染色體間的染色體易位,僅有3.91%發(fā)生在同源染色體之間,而六倍體中高達(dá)49.69%的易位是在同源染色體之間發(fā)生的,且六倍體燕麥中的同源交換有88.4%(931.94/1054.30 Mb)發(fā)生在A和D亞基因組之間,遠(yuǎn)高于A和C(11.2%,117.71/1054.30 Mb)或D和C(0.04%,4.66/1054.30 Mb),表明六倍化后的同源交換在栽培燕麥基因組結(jié)構(gòu)的形成中發(fā)揮了重要作用,且在多倍體細(xì)胞核中關(guān)系更近的同源基因組更易于產(chǎn)生亞基因組間的重組,六倍體燕麥中A和D亞基因間相似性很高,而這兩個(gè)基因組與C亞基因間的差異相對(duì)較大,因此同源交換主要發(fā)生在A和D亞基因組之間,且這兩個(gè)基因組間大量頻繁的染色體重組形成了類似馬賽克的染色體鑲嵌結(jié)構(gòu),這也是六倍體燕麥的A和D亞基因組起源問題一直存在爭(zhēng)議的重要原因。

圖4 燕麥屬物種多倍化過程中的染色體結(jié)構(gòu)變異

a,六倍體燕麥的亞基因組與可能的四倍體和二倍體祖先之間的共線性。黃色和藍(lán)色箭頭和線條分別代表觀察到的來自A和C基因組的大染色體易位(>40MB)。深灰色箭頭和線條表示四倍體A. insularis和“Sanfensan”之間3C染色體倒位;
b,將C基因組二倍體序列比對(duì)到六倍體參考基因組顯示C-A和C-D基因組間的大片段易位;
c,C基因組特異性重復(fù)序列為探針的FISH證實(shí)了C-A和C-D基因組易位。來自A基因組特異性重復(fù)序列(As120a)的熒光信號(hào)以綠色顯示,來自C基因組特異性重復(fù)序列(Am1)的信號(hào)以紅色顯示。白色箭頭表示C-D和C-A基因組間易位;
d, FISH驗(yàn)證六倍體燕麥基因組中3C染色體倒位。探針5SrDNA(紅色)和6C343(綠色)分別在四倍體3C染色體的短臂和長(zhǎng)臂上出現(xiàn)了明顯的雜交信號(hào),而這兩個(gè)信號(hào)都同時(shí)出現(xiàn)在六倍體3C染色體的長(zhǎng)臂。

五、燕麥屬物種多倍化過程中的亞基因進(jìn)化

此外,多方面的證據(jù)顯示六倍體燕麥在進(jìn)化過程中已出現(xiàn)優(yōu)勢(shì)亞基因組(圖5):

  • 首先,PAV分析顯示在C亞基因組中的基因丟失率較高,且C亞基因組中有更多收縮的基因家族;
  • 第二,Ka/Ks分析表明C亞基因組受到的純化選擇少于六倍體燕麥的其他兩個(gè)亞基因組;
  • 第三,C亞基因組包含更多轉(zhuǎn)座因子(TE),并且在基因附近顯示出比A和D亞基因組更高的TE密度,而基因附近TE密度相對(duì)較高的基因往往具有較低的表達(dá)水平;
  • 第四,通過對(duì)干旱、水澇、高溫、低溫、鹽脅迫和堿脅迫下以及燕麥不同組織的亞基因組的表達(dá)模式分析表明C亞基因組中表達(dá)的基因數(shù)量顯著低于A和D亞基因組,這些結(jié)果均表明六倍體燕麥中存在亞基因組優(yōu)勢(shì)。
圖5 燕麥屬物種多倍化過程中的亞基因進(jìn)化

a,四倍體和六倍體燕麥在多倍化過程中相對(duì)其二倍體親本的同源基因丟失情況(PAV);
b,六倍體燕麥三個(gè)亞基因組Ka/Ks值分布;
c,六倍體燕麥三個(gè)亞基因組中基因附近TE密度的比較。相對(duì)于A和D亞基因組中的同源染色體,C亞基因組中基因附近的TE密度最高;
d, 六倍體燕麥A、C和D三個(gè)亞基因組的同源基因表達(dá)差異。

六、R基因分析

燕麥在生長(zhǎng)中受到病害的威脅,其中最嚴(yán)重的是冠銹病。NBS-LRR蛋白質(zhì)由一類抗性基因(R基因)編碼,在植物免疫中發(fā)揮重要作用。研究人員在六倍體燕麥的三個(gè)亞基因組中鑒定了1269個(gè)R基因,與四倍體和二倍體不同亞基因組中鑒定的數(shù)量相比顯示出收縮。大多數(shù)R基因在染色體端部成簇出現(xiàn),且與燕麥已知的冠銹病基因QTL區(qū)段共定位,表明本研究構(gòu)建的燕麥參考基因組可以為燕麥抗病基因的定位和克隆提供有效的參考(圖6)。

圖6 R基因在燕麥基因組中鑒定及其在染色體上的分布

a, 比較六倍體燕麥及其假定祖先基因組中R基因數(shù)量;
b,冠銹病抗性QTL位點(diǎn)和R基因在六倍基因組染色體上的分布。

七、燕麥裸粒性狀的全基因組關(guān)聯(lián)分析及候選基因預(yù)測(cè)

栽培燕麥根據(jù)其籽粒外殼包被情況,分為皮燕麥和裸燕麥兩類。燕麥籽粒的皮裸性狀是重要的馴化性狀之一(圖7a)。本研究通過對(duì)659份不同來源地的栽培燕麥的49702個(gè)SNP進(jìn)行了全基因組關(guān)聯(lián)分析,在染色體4D末端檢測(cè)到顯著關(guān)聯(lián)區(qū)域,與之前報(bào)道的控制皮裸性狀的N1基因位點(diǎn)區(qū)域一致。候選基因預(yù)測(cè)篩選到一個(gè)注釋為受體樣激酶(RLK)的基因,該基因在擬南芥中的同源基因AtVRLK1參與次生細(xì)胞壁加厚,在水稻的同源基因mis2的突變體中顯示開殼小穗。比較該基因在皮、裸燕麥中的編碼序列差異,發(fā)現(xiàn)在第一個(gè)外顯子中的SNP會(huì)引起氨基酸變化。根據(jù)該SNP位點(diǎn)開發(fā)競(jìng)爭(zhēng)等位基因特異性PCR(KASP)標(biāo)記驗(yàn)證了其與皮、裸性狀的相關(guān)性;通過比較10個(gè)皮燕麥和12個(gè)裸燕麥之間的轉(zhuǎn)錄組數(shù)據(jù),該研究發(fā)現(xiàn)該基因在裸燕麥中高表達(dá);同時(shí),在燕麥不同發(fā)育階段的穗部表達(dá)模式也表明該基因在裸燕麥穗部發(fā)育過程中的表達(dá)量遠(yuǎn)高于皮燕麥。這些結(jié)果表明A.satnudsfs4d01g00045是控制燕麥的皮裸性狀可能的候選基因(圖7)。

圖7 燕麥裸粒性狀的全基因組關(guān)聯(lián)分析及候選基因預(yù)測(cè)

a,皮裸燕麥的小穗和籽粒;
b,659個(gè)燕麥品種全基因組關(guān)聯(lián)分析N1候選區(qū)域關(guān)聯(lián)映射的曼哈頓圖及其候選基因A.satnudsfs4d01g00045的基因結(jié)構(gòu);
c,基因SNP差異的KASP標(biāo)記驗(yàn)證A.satnudsfs4d01g00045與皮裸性狀之間的關(guān)聯(lián);
d,A.satnudsfs4d01g00045在10個(gè)皮燕麥和12個(gè)裸燕麥七個(gè)不同組織或不同發(fā)育時(shí)期等量混合的RNA樣本中的表達(dá)水平;e, A.satnudsfs4d01g00045在裸燕麥“三分三”和皮燕麥“Ogle”穗部不同發(fā)育時(shí)期的表達(dá)水平比較。S1、S2、S3和S4分別代表孕穗期(Zadok's 45)、抽穗期(Zadok's 50)、開花期(Zadok's 58)和灌漿期(Zadok's 83)的穗。

原文鏈接:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9355876/

轉(zhuǎn)自:https://mp.weixin.qq.com/s/VarQmxQNuxGFSggRvcqg-w

https://mp.weixin.qq.com/s/WrB_3V-48xxdJlKJWkXmUQ

https://mp.weixin.qq.com/s/8lxVYJGXPOjz3qdTeRYcjg

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容