馬鈴薯是全球性的重要作物,目前商業(yè)種植主要采用的是同源四倍體馬鈴薯塊莖,運(yùn)輸和種植都多有不便。因此如果能使用二倍體馬鈴薯種子種植將會(huì)降低種植成本,便于馬鈴薯育種。但目前馬鈴薯基因組進(jìn)化和物種多樣性的研究十分有限。而本文填補(bǔ)了馬鈴薯泛基因組進(jìn)化的空白并為馬鈴薯基因組設(shè)計(jì)育種提供了新的見解。
文章信息
- 題目:Genome evolution and diversity of wild and cultivated potatoes
- 期刊和時(shí)間:NATURE,2022.6
- 作者和單位:通訊作者來自中國農(nóng)科院深圳基因組所黃三文研究員。
研究背景
- 商業(yè)種植的馬鈴薯主要是塊莖繁殖的同源四倍體。
- 自然界中二倍體馬鈴薯占據(jù)多數(shù),但是其遺傳多樣性還未曾闡明。
- 馬鈴薯塊莖繁殖所造成的進(jìn)化上的影響也未被探索。
- 讓馬鈴薯從塊莖的無性繁殖變?yōu)榉N子的有性繁殖能加速育種和遺傳改良。從而推進(jìn)分子育種技術(shù)在馬鈴薯上的使用。
研究結(jié)果
1.馬鈴薯泛基因組的建立
作者基于432個(gè)馬鈴薯株系建立起的系統(tǒng)發(fā)育樹中選取了44個(gè)代表性株系,對(duì)其進(jìn)行了Pacbio HiFi測(cè)序。并且在這44個(gè)株系中又選擇了7個(gè)株系進(jìn)行Hi-C測(cè)序并組成完整的基因組。
接下來為了構(gòu)建馬鈴薯全基因庫,作者利用44株馬鈴薯代表性物種+現(xiàn)有的一個(gè)馬鈴薯參考基因組S. tuberosum Group Phureja構(gòu)建了泛基因組。通過聚類預(yù)測(cè)基因模型作者發(fā)現(xiàn)當(dāng)馬鈴薯物種數(shù)在40左右的時(shí)候,泛基因組規(guī)模(聚類預(yù)測(cè)基因數(shù)量)增大到了一個(gè)瓶頸。說明此時(shí)泛基因組已經(jīng)能夠反映物種的核心基因情況。因此作者根據(jù)基因簇出現(xiàn)頻率將其劃分成四類:核心基因(core clusters ,存在于所有45份材料中)、次核心基因(soft-core clusters,存在于42-44份材料中)、邊緣基因(shell clusters,存在于2-41個(gè)個(gè)體中)和特異性基因(accession-specific clusters)。這些泛基因組資源為利用馬鈴薯生物學(xué)和育種中的全段基因庫提供了一個(gè)起點(diǎn)。
2.馬鈴薯家族及其近親系統(tǒng)發(fā)育關(guān)系
由于馬鈴薯家族遺傳多樣性和發(fā)育關(guān)系還未曾闡明,作者利用三代測(cè)序Pacbio從頭測(cè)序了兩個(gè)馬鈴薯的祖先種Etuberosum(Solanum etuberosum和Solanum palustre)并構(gòu)建了系統(tǒng)發(fā)育樹(Fig1a)。
Etuberosum是馬鈴薯的祖先種,其下部不結(jié)薯塊,能產(chǎn)生類似馬鈴薯的根狀莖;但沒有類似馬鈴薯的匍匐莖,而是向上直立生長。Lycopersicon同時(shí)缺乏根狀莖和匍匐莖。因此Etuberosum被認(rèn)為是馬鈴薯祖先種/姐妹群,而Lycopersicon被認(rèn)為是馬鈴薯的外群(親緣關(guān)系距離馬鈴薯更遠(yuǎn))。
結(jié)薯種tuberosum和不結(jié)薯種Etuberosum
結(jié)果非常Amazing!系統(tǒng)發(fā)育樹關(guān)系顯示(Fig1a)兩個(gè)馬鈴薯的祖先種Etuberosum( 橙色塊位置)與馬鈴薯家族的關(guān)系要比三個(gè)“外群”種Lycopersicon(綠色快位置)更近,這和剛剛的假設(shè)產(chǎn)生了矛盾。此外作者分別使用單拷貝基因簇建樹以及基因組隨機(jī)滑窗建樹,發(fā)現(xiàn)二者大致一致,但也存在相當(dāng)數(shù)量的分歧。這兩點(diǎn)都說明了馬鈴薯家族進(jìn)化關(guān)系相當(dāng)復(fù)雜,在這里作者推斷可能是發(fā)生了種間基因滲入。因此采用了D統(tǒng)計(jì)和f4統(tǒng)計(jì)檢測(cè)基因流及基因流動(dòng)比例。D統(tǒng)計(jì)結(jié)果顯示馬鈴薯家族 Petota 及其祖先Etuberosum存在明顯的基因流動(dòng)(fig1c),馬鈴薯基因組上8.4%的基因是由Etuberosum流入的。種間基因流一定程度上解釋了馬鈴薯家族系統(tǒng)發(fā)育的混亂。
注解:Fig1a估計(jì)了32個(gè)馬鈴薯家族物種的系統(tǒng)發(fā)育關(guān)系,通過ASTRAL軟件讀取3971個(gè)單拷貝基因建立了主發(fā)育關(guān)系(黑色實(shí)線)。ASTRAL采用多物種溯祖方法能夠避免不完全譜系分選的情況,以此建立出物種發(fā)育樹。淺灰色實(shí)線是分別從各物種全基因組選取100k的滑窗所建立起的500棵子發(fā)育樹。作者為了避免單基因建樹可能反映不了真實(shí)物種分歧,因此采用了這兩種方法分別建樹并統(tǒng)計(jì)分枝的支持度。兩種方法建樹結(jié)果在主要節(jié)點(diǎn)一致,但仍有很多分歧,再一次反映出馬鈴薯家族進(jìn)化的混亂。b圖是馬鈴薯家族物種分布圖,使用了R包worldmap繪制。c圖是D統(tǒng)計(jì)檢驗(yàn)的結(jié)果,D統(tǒng)計(jì)采用ABBA-BABA模型統(tǒng)計(jì)基因流動(dòng)(gene flow),有機(jī)會(huì)小編單獨(dú)出一篇講講D統(tǒng)計(jì)量。
3.馬鈴薯抗性基因庫的擴(kuò)張
采用無性繁殖獲得的馬鈴薯容易感染塊莖疾病,但實(shí)際上馬鈴薯可能通過擴(kuò)張抗性基因庫抵抗這些疾病。馬鈴薯的免疫系統(tǒng)進(jìn)化值得深入研究。在這里作者開發(fā)了新的NLR基因注釋方法,其結(jié)合NLR-annotator和MAKER2兩款軟件,前者實(shí)現(xiàn)NLR基因的初步預(yù)測(cè),后者能夠根據(jù)現(xiàn)有Renseq數(shù)據(jù),采用機(jī)器學(xué)習(xí)方法從頭預(yù)測(cè)NLR基因并進(jìn)行基因組注釋。最終二者取并集即為NLR基因重注釋的結(jié)果。以此法作者注釋了上述45個(gè)馬鈴薯家族成員一共 57,683個(gè)NLR基因。并且發(fā)現(xiàn)不同馬鈴薯種間NLR基因拷貝數(shù)差異巨大(Fig2ab)。
注解:Fig2a統(tǒng)計(jì)了45個(gè)馬鈴薯種內(nèi)預(yù)測(cè)含有的各類型NLR基因的數(shù)量并按照NLR基因類型展示。b圖也是NLR基因數(shù)量,按照物種展示。c圖針對(duì)R基因家族R3a進(jìn)行了同線性分析,以標(biāo)明其在各個(gè)物種中的動(dòng)態(tài)。
與祖先種Etuberosum(ETB)和番茄基因組相比,馬鈴薯基因組中含有的NLR基因有了很大程度的擴(kuò)張。作者將這些NLR基因分成了424個(gè)簇,其中161個(gè)簇呈現(xiàn)出擴(kuò)張的跡象。這里面就包含了著名的馬鈴薯抗性基因R3a(Fig2c)。
4.馬鈴薯結(jié)薯基因SP6A的進(jìn)化
馬鈴薯塊莖儲(chǔ)存了大量的營養(yǎng)物質(zhì),有助于馬鈴薯的存活。前人為數(shù)不多的研究發(fā)現(xiàn),馬鈴薯結(jié)塊基因受到順式作用元件(cis-regulatory elements,CREs)的調(diào)控,而后者在進(jìn)化上存在規(guī)律。順式作用元件通常以非編碼的保守序列(conserved non-coding sequences,CNS)出現(xiàn),作者因此根據(jù)45個(gè)馬鈴薯株系基因組保守性得分計(jì)算出149,663個(gè)馬鈴薯特異性CNS。其中54.4%CNS存在于內(nèi)含子位置,可能對(duì)結(jié)薯產(chǎn)生潛在影響。
為了進(jìn)一步定位結(jié)薯相關(guān)基因,作者在塊莖中檢測(cè)到732種表達(dá)的基因,在這之中229個(gè)基因關(guān)聯(lián)于馬鈴薯特異性CNS且在45個(gè)馬鈴薯株系中保持了保守性(Fig3a)。前任的研究顯示TCP基因家族參與分生組織的發(fā)育,而這些基因中僅一個(gè)基因(Soltu.DM.06G025210)屬于TCP家族。關(guān)聯(lián)于此基因的CNS位于啟動(dòng)子上游376bp和157bp(Fig3b),可能調(diào)控此TCP的表達(dá)。轉(zhuǎn)錄組分析進(jìn)一步證明了Soltu.DM.06G025210表達(dá)于馬鈴薯的匍匐莖或塊莖,而在遠(yuǎn)親番茄中卻測(cè)不到表達(dá)(Fig3c),符合番茄到馬鈴薯譜系的分化特點(diǎn)。
下面就到了我們最熟悉的基因功能驗(yàn)證了,作者利用CRISPR–Cas9構(gòu)建了敲除突變體 it1(Fig3de)。表型一目了然,Soltu.DM.06G025210對(duì)結(jié)薯的作用非常關(guān)鍵。突變體it1結(jié)薯受到了顯著抑制(Fig3de)。因此Soltu.DM.06G025210由于其調(diào)控結(jié)薯,被重命名為IT1(Identity of Tuber 1)。
緊接著,作者為了找到與IT1互作的基因,進(jìn)行了酵母雙雜實(shí)驗(yàn)。篩選得到了SP6A(SELF-PRUNING 6A )基因,控制著薯塊維管束運(yùn)輸信號(hào)(Fig3f)。SP6A可能與IT1形成復(fù)合體調(diào)控薯塊形成。在馬鈴薯祖先(ETB)中也有一段SP6A的同源序列 SP6Aetb,但是該序列在ETB中卻檢測(cè)不到表達(dá)(Fig3c)。于是作者對(duì)IT1及其同源進(jìn)行了結(jié)構(gòu)分析,結(jié)果發(fā)現(xiàn)其PEBP域產(chǎn)生了缺失(Fig3g)。SP6A結(jié)構(gòu)域的缺失導(dǎo)致了馬鈴薯祖先ETB不能結(jié)薯。
5.馬鈴薯泛基因組指導(dǎo)雜交育種
高度純合的自交系對(duì)于雜交育種至關(guān)重要。因此作者希望調(diào)查所研究株系的純合度以備選可能的雜交材料。此外,由于倒置(inversions)會(huì)抑制重組,在雜交的時(shí)候會(huì)產(chǎn)生連鎖阻力,從而阻礙育種。育種需要選擇含有目的基因但又不含倒置片段的物種作為供體。因此作者利用20株馬鈴薯地方種和4株栽培種祖先(ETB)構(gòu)建了大尺度倒置圖譜(Fig4a)。在這之中作者發(fā)現(xiàn)與參考基因組相比(DM/PG5068)馬鈴薯祖先種(PG5068)三號(hào)染色體上有一段5.8Mb的基因倒置(Fig4b),與控制塊莖胡蘿卜素合成的Y位點(diǎn)(Y locus)連鎖。二者難以發(fā)生重組,重組事件分布圖(Fig4c)也證實(shí)了這一點(diǎn):該inversion所在位置重組事件發(fā)生率急劇降低。
說明農(nóng)業(yè)上如果選擇具有黃色塊莖肉(胡蘿卜素合成多)的個(gè)體,可能會(huì)同時(shí)選擇出該倒置,從而導(dǎo)致表型連鎖阻力。借助這里構(gòu)建的泛基因組倒置圖譜,育種家能選擇合適的供體或受體株系進(jìn)行回交。
總結(jié):
新穎且內(nèi)容極其豐富的泛基因組研究。作者從構(gòu)建馬鈴薯泛基因組,討論馬鈴薯家族和祖先種系統(tǒng)發(fā)育關(guān)系。從免疫基因擴(kuò)庫和結(jié)薯基因上詳細(xì)研究了馬鈴薯家族的進(jìn)化關(guān)系。其結(jié)薯基因IT1的鑒定方法能結(jié)合CNS關(guān)聯(lián)讓人耳目一新。生信層面之外作者還進(jìn)行了基因功能驗(yàn)證,結(jié)合CRISPR技術(shù)呈現(xiàn)出極為明顯的結(jié)薯表型,無論是基因鑒定手段還是基因功能本身,都具有學(xué)術(shù)和應(yīng)用價(jià)值。關(guān)鍵一作還是個(gè)博士生(不是博后或副研),博士的悲喜并不相同,我只覺得自己太菜。
文獻(xiàn)閱讀僅供參考,如有謬誤歡迎各位大佬批評(píng)指正哈。
1. Tang, D., Jia, Y., Zhang, J. et al. Genome evolution and diversity of wild and cultivated potatoes. Nature (2022). https://doi.org/10.1038/s41586-022-04822-x