Sun X, Jiao C, Schwaninger H, et al. Phased diploid genome assemblies and pan-genomes provide insights into the genetic history of apple domestication. Nature Genetics, 2020, DOI: 10.1038/s41588-020-00723-9.
科學網—重磅推薦!康奈爾大學費章君團隊揭示蘋果馴化的遺傳學歷史 - 小柯生命的博文
分相的二倍體基因組組裝和泛基因組提供了對蘋果馴化遺傳史的見解
摘要
蘋果的馴化主要是由種間雜交驅動的。本研究報告了栽培的蘋果(Malus domestica cv. Gala)和其兩個主要野生祖先,M. sieversii和M. sylvestris的單倍型解析基因組。在每個基因組的兩個單倍型之間鑒定出實質性的變異。基因組血統的推斷可確定約有23%的Gala基因組來自雜種。對91份蘋果種質進行了深測序,確定了栽培蘋果的選擇性清除,這些選擇性清除起源于兩個祖先中的任何一個,并且與重要的馴化性狀有關。通過對蘋果pan基因組的構建和分析,發現了數千個新基因,其中數百個是從其中一個祖先中篩選出來的,并且大部分固定在栽培蘋果中,揭示了新基因/等位基因的導入是蘋果通過雜交馴化的一個標志。最后,Gala果實在13個發育階段的轉錄組圖譜揭示了19%的等位基因特異性表達,包括許多與果實品質相關的基因。
正文
作物馴化對人類的人口增長和文明發展起著至關重要的作用。今天,人類嚴重依賴于數千年前被馴化的多種農作物1。通過技術創新加強了關鍵作物的遺傳改良2,3,但由于馴化作物的遺傳多樣性狹窄而受到阻礙。作物野生近緣種是育種遺傳物質的重要來源,而這些野生近緣種所需性狀的潛在基因常常被用來改良馴化種質4,5。盡管基因信息很重要,但用于作物野生親緣關系的基因組信息卻很少6。
大多數作物基因組復雜,具有基因組大、雜合度高、多倍體等特點7。這種復雜性對植物基因組組裝提出了挑戰,為了獲得高質量的基因組,通常需要在參考選擇上付出更多的努力,而且在許多情況下,低倍性的純合系更受青睞8,9。然而,許多植物在自然界中是自由授粉的,因此雜合基因組區域可能是表型變異的主要因素10。因此,對自然雜合系的直接測序可以提供對其遺傳復雜性的深入見解11。另一方面,植物往往具有遺傳結構,單一的參考基因組決不能代表整個群體。因此,除了線性參考基因組外,還可以生成一個復雜的種群多樣性表示形式。這種表現形式的變體,包括基于基因的12,13或基于序列的14,15泛基因組,成功地捕獲了隱藏的遺傳多樣性,并促進了重要性狀16,17的遺傳基礎的發現。
蘋果(Malus domestica Borkh.)是一種廣受歡迎的溫帶水果,其馴化是通過不同野生種的雜交和優良性狀基因型的克隆繁殖來實現的。在野生種中,M. sieversii和M. sylvestris是主要的祖先18,19,20。蘋果基因組高度雜合,對早期的基因組組裝21,22提出了重大挑戰。目前,栽培蘋果的參考質量基因組組合可用于雙單倍體系GDDH13(參考文獻9)、三單倍體HFTH1(參考文獻23)和二倍體品種“Gala Galaxy”24;對于其野生近緣物種,只有M. baccata的基因組草圖可用25。在本研究中,我們組裝了栽培蘋果Gala的參考級、相性二倍體基因組,這是一個生長在世界各地的頂級品種,以及兩個主要的野生祖先M. sieversii和M. sylvestris。我們直接測序雜合系,揭示了基因組的二倍體狀態。我們還構建了基于91份深度重測序的蘋果屬植物的泛基因組。這些高質量的參考基因組和泛基因組可以更好地了解蘋果馴化的遺傳基礎,為今后蘋果的研究和育種提供寶貴的資源。
結果
基因組組裝與同源染色體構建
我們為這3份種質獲得了623-780倍的Illumina和10x基因組序列的覆蓋率,以及37-81倍的PacBio-HiFi序列覆蓋率(補充表1)。對于每份種質,reads被組裝成一個包含定相scaffold的二倍體基因組,以及一個傳統的單倍體合并基因組(補充圖1)。對于二倍體基因組,最終組裝體的大小為1.31-1.32GB,對于單倍體合并基因組,大小為652-668?Mb(補充表2)。盡管雜合度較高(0.85-1.28%),但所有的組裝都表現出很高的連續性,二倍體組合體的scaffold N50為3.3-4.3?Mb,單倍體合并基因組的scaffold N50為16.8-35.7?Mb(補充表2)。利用高密度的遺傳圖譜26,27和與已發表的基因組9,成功地錨定了96.7–97.8%的單倍體合并基因組scaffold。
二倍體組裝的大小大約是單倍體基因組的兩倍,這表明同源染色體在每個組裝中都得到了很好的捕獲,這進一步得到了k-mer譜分析的支持(擴展數據圖1)。大約93.7-95.5%的定相scaffold被分成兩個非冗余的集合(又稱為haplomes),它們被進一步錨定在17個同源染色體上。每個haplome的累積大小為單倍體基因組的88.5–100.0%(補充表2),所有三份材料都顯示出兩個haplome之間的高度共線性(圖1a)。使用多種方法的基因組評估證實了單倍體和二倍體組裝的高質量(補充注釋和擴展數據圖2)。
圖1:Gala,M. sieversii和M. sylvestris的基因組和進化。
在二倍體組裝中,總共預測了90147-90507個蛋白質編碼基因,在單倍體組裝中預測了45199-45352個蛋白質編碼基因(補充表2)。核苷酸結合、富含亮氨酸的重復基因廣泛參與抗病28,并且在蘋果屬植物中發現高度可變(補充說明、補充表3和補充圖2)。
我們的組裝顯示出與已發表基因組的整體高共線性(補充圖3),除了1號染色體上的5-Mb倒位,我們發現這可能是GDDH13和HFTH1基因組中的錯誤組裝(擴展數據圖3)。我們鑒定了單倍體之間的實質性差異,包括2387290、2591444和2929832個單核苷酸多態性(SNPs)、363464、364605和401893個插入/缺失,以及M.sieversii、M.sylvestris和Gala的202、343和330個倒位(補充表4和補充圖4)。
大約58.7–59.4%的蘋果基因組是重復序列,類似于GDDH13和HFTH1的基因組(補充表5和補充圖5)。我們發現在蘋果進化過程中發生了兩次長末端重復轉座子(LTR-RT)爆發,其中較老的一次發生在蘋果和梨29的物種形成之前,最近的一次發生在M.sylvestris和M.sieversii分化為亞群之前(圖1b、c和補充圖)。6和7)。LTR-RTs在重復爆發后的進化可能創造了物種間豐富的遺傳多樣性。一個值得注意的例子是redTE逆轉錄轉座子,它在一些蘋果品種中轉移到MYB1基因座上,導致了紅色果皮23。我們發現redTE只存在M.sieversii和M.domestica中,它以短雜合子的形式存在于Gala中,可能導致MYB1等位基因的特異性表達,從而導致Gala的黃紅果皮顏色(補充注釋和擴展數據圖4)。