2022《Nature Genetics》甘蔗種質(zhì)資源演化

2022年6月2日,福建農(nóng)林大學(xué)海峽聯(lián)合研究院基因組中心張積森團隊在《自然-遺傳學(xué)》(Nature Genetics)上發(fā)表了題為“Genomic insights into the recent chromosome reduction of autopolyploid sugarcane Saccharum spontaneum”的研究論文,這是基因組中心團隊繼2018年解析甘蔗基因組(Zhang et al., 2018, Nature Genetics)后的又一重大進展。該研究解析了細莖野生種天然同源四倍體Np-X基因組,并利用基因組學(xué)手段系統(tǒng)闡明了甘蔗細莖野生種(又稱割手密)的起源、染色體基數(shù)、基因組倍體、關(guān)鍵性狀相關(guān)基因的演化,為甘蔗的基因組輔助育種奠定了重要的理論基礎(chǔ)。

現(xiàn)代栽培甘蔗是100多年前高貴種與細莖野生種人工雜交后產(chǎn)生,高貴種是同源八倍體,種內(nèi)的材料擁有穩(wěn)定的核型(2n=8x=80),而細莖野生種為現(xiàn)代甘蔗栽培種貢獻了抗逆、分蘗等優(yōu)良性狀,也實現(xiàn)了甘蔗在育種史上最大的突破。但細莖野生種分布區(qū)域廣(從地中海到太平洋),并且其具有寬泛的倍性變異(從四倍到十六倍)和基礎(chǔ)染色體數(shù)變異(8,9,10),其中,十六倍體的細莖野生種是甘蔗屬已知的倍性最高的材料,由于細莖野生種遺傳背景的高度復(fù)雜,其起源和演化是研究界百余年來懸而未決的重要科學(xué)問題,這極大地限制了現(xiàn)代甘蔗育種的進程

甘蔗屬的遺傳背景極其復(fù)雜,最早有關(guān)甘蔗屬染色體核型的報道可以追溯到1929年,Bremer用經(jīng)典細胞學(xué)鑒定了雜種甘蔗POJ2725的染色體數(shù)為106-107,但是鑒定結(jié)果極不穩(wěn)定。隨著科技的進步,以經(jīng)典細胞學(xué)為基礎(chǔ)衍生出來的分子細胞學(xué)為甘蔗遺傳背景的鑒定提供了重要的手段,但由于實驗的手法限制,并且甘蔗是復(fù)雜的多倍體,諸多的干擾因素仍然給甘蔗屬遺傳背景的解析帶來了大量困難,因此,百余年來,甘蔗屬的遺傳背景一直是未解之謎。自人類基因組計劃完成以來,基因組測序技術(shù)得到了飛速發(fā)展,為復(fù)雜物種遺傳背景的解析帶來了新的契機。研究團隊突破了同源多倍體基因組組裝的挑戰(zhàn),成功解析了甘蔗細莖野生種遺傳背景的演化規(guī)律,將為甘蔗的遺傳育種提供重要的理論指導(dǎo)。

一、一個祖先核型同源多倍體細莖野生種基因組組裝與注釋。

研究選擇了染色體基數(shù)為x = 10的自然同源四倍體割手密Np-X(2n = 4x = 40)為對象進行了深入研究。為了克服同源多倍體分型組裝上的困難,研究人員利用高準確性的基于PacBio測序平臺的CCS reads對其進行了基因組組裝,并利用Hi-C技術(shù)對該基因組進行了掛載,最終得到了2.76 Gb染色體水平的基因組,并且在超過92%的染色體中組裝出了著絲粒結(jié)構(gòu)。為了確保同源組內(nèi)分型的準確,研究還利用了基于ONT平臺的Ultra-long reads對基因組的組裝質(zhì)量進行了獨立驗證,超過90%的Ultra-long reads能夠以高匹配度比對到組裝的基因組上,并且同源染色體之間的錯誤連接率不足4%。高質(zhì)量的Np-X基因組的獲得為基因組結(jié)構(gòu)和群體基因組學(xué)分析奠定了重要的基礎(chǔ)。

圖1. 細莖野生種Np-X與AP85-441的表型、核型和基因組特征的比較

a. 細莖野生種Np-X與AP85-441表型的比較;
b. Np-X的基因組特征;
c. Np-X的核型;
d. Np-X與高粱的共線性比較;
e. Np-X與AP-441的共線性比較。

二、一對古復(fù)制的染色體的近期演化

通過基因組結(jié)構(gòu)的比較,結(jié)合FISH證據(jù)和HiC信號的結(jié)果發(fā)現(xiàn)了割手密種染色體基數(shù)由x = 10到x = 8的演化是由于祖先的5號和8號染色體在著絲粒區(qū)域發(fā)生了斷裂,斷裂的著絲粒在重組后的染色體上逐漸退化,并且,研究人員在斷裂的著絲粒上分別鑒定到了6.5Mb和7.1Mb區(qū)域的丟失,并在該區(qū)域分別鑒定到了15和28個基因。

祖先的5號和8號染色體是來源于禾本科ρ事件的一對古復(fù)制的染色體,這兩條染色體上存在著大量的抗病相關(guān)的R基因(Zhang et al., 2018),意味著這兩條染色體極具育種利用的潛力,為了理清這兩條染色體的演化特征,研究人員從整個禾本科的視角出發(fā),探究它們的協(xié)同演化規(guī)律,發(fā)現(xiàn)這兩條染色體上的基因在x = 8的AP85-441中相對于x = 10的Np-X受到了更弱的選擇。通過轉(zhuǎn)錄組發(fā)現(xiàn)這兩條染色體上的基因存在大量的劑量冗余,說明它們正在進行快速的進化。

圖2. 古復(fù)制的染色體對的演化

a. Oligo-Fish分析割手密Np-X與AP85-441的中期染色體;
b. 古復(fù)制的染色體對在禾本科的演化;
c. 古復(fù)制的染色體對在AP85-441中發(fā)生了染色體重排;
d. 重組斷點區(qū)域丟失的基因。

三、甘蔗屬關(guān)鍵生物學(xué)分化性狀的基因演化

研究鑒定了多個甘蔗關(guān)鍵性狀(糖分積累、糖分代謝、葉片寬窄、光合作用、抗病等)相關(guān)的家族基因,并解析了其在禾本科中的系統(tǒng)演化關(guān)系。研究基于甘蔗屬內(nèi)的表達譜找到8個基因可能與細莖野生種Np-X的光合作用相關(guān),并發(fā)現(xiàn)甘蔗屬內(nèi)參與C4途徑的成員基因的類型和其受到的表達調(diào)控表現(xiàn)出趨同進化。研究還發(fā)現(xiàn)糖轉(zhuǎn)運蛋白基因PLT家族在Np-X和AP85-441基因組中均發(fā)生了擴張,而STP基因家族的擴張只發(fā)生AP85-441基因組中,這些基因家族的成員可能在這兩個細莖野生種材料中是獨立演化的。

研究比較了熱帶種和細莖野生種甘蔗糖分轉(zhuǎn)運蛋白基因的上游調(diào)控序列的結(jié)構(gòu),認為在甘蔗屬中調(diào)控糖分積累的機制是依靠調(diào)控轉(zhuǎn)錄表達進行的,而不是通過功能基因的獲得或丟失。此外,研究還利用熱帶種、細莖野生種的轉(zhuǎn)錄組與葉片寬度的性狀進行關(guān)聯(lián),鑒定到了2個與葉片寬度相關(guān)的NAL基因(NAL1和NAL10),可以用于后續(xù)的功能驗證。

圖3. 甘蔗重要性狀相關(guān)基因家族的擴張

a. 甘蔗重要性狀相關(guān)基因家族成員在禾本科中的分布;
b. C4光合相關(guān)基因在三個甘蔗材料不同組織中的表達譜;
c. 控制葉片寬窄性狀的關(guān)鍵基因在三個甘蔗材料不同組織中的表達譜。

四、甘蔗屬的多倍化與演化

為了理清甘蔗屬的系統(tǒng)演化關(guān)系,研究人員分別利用堿基同義替換率和LTR類型的轉(zhuǎn)座子插入事件對甘蔗屬內(nèi)的演化規(guī)律進行了解析,發(fā)現(xiàn)割手密種與熱帶種的分化時間為1.6百萬年,割手密Np-X與AP85-441的分化時間為0.8百萬年。明確了以x = 10的割手密核型是甘蔗屬核型的祖先模式,并且八倍體的熱帶種(2n = 8x = 80)和割手密種(2n = 8x = 64)都經(jīng)歷了兩次全基因組加倍事件,而四倍體的割手密Np-X只經(jīng)歷了一次加倍事件。

圖4. 甘蔗屬的演化

a. 甘蔗屬及其近緣種間的堿基同義替換率(Ks);
b. 甘蔗屬及其近緣種轉(zhuǎn)座子的爆發(fā)時間;
c. Np-X基因組中全長LTR-RTs的分類;
d. 甘蔗屬中轉(zhuǎn)座子序列一致性分析;
e. 甘蔗屬中不同序列一致性轉(zhuǎn)座子峰值的時間估計;
f. 甘蔗屬演化結(jié)構(gòu)。

五、細莖野生種種群的染色體基數(shù)與倍性的近期演化

甘蔗細莖野生種具有非常寬泛的遺傳背景和廣泛的地理分布,細莖野生種被用于甘蔗育種已有百余年的歷史,然而,細莖野生種的起源和群體演化一直是個謎,為了研究細莖野生種群體的遺傳多樣性,研究人員基于高質(zhì)量的細莖野生種Np-X基因組,對分布在世界范圍內(nèi)的102份割手密材料進行了遺傳多樣性分析,系統(tǒng)進化樹和群體結(jié)構(gòu)分析表明細莖野生種起源于印度北部,細莖野生種群體可以分為4個亞群,其中,亞群1與亞群2之間存在較弱的基因交流,這4個亞群之間獨立演化。

圖5. 細莖野生種群體的遺傳關(guān)系

a. 細莖野生種重測序樣本地理位置分布;
b. PCA分析;
c. 系統(tǒng)發(fā)育樹分析;
d. 群體結(jié)構(gòu)分析;
e. 基因流分析。

染色體基數(shù)變異廣泛存在于甘蔗細莖野生種中,傳統(tǒng)依賴于細胞學(xué)FISH手段鑒定細莖野生種染色體基數(shù)的方法固然有效,但是存在實驗誤差和探針非特異性結(jié)合等因素的干擾,并且實驗周期較長。為此,研究人員開發(fā)了一種基于5號和8號染色體著絲粒區(qū)域reads覆蓋度的方法來鑒定細莖野生種的染色體基數(shù),該方法快捷、簡易、準確、高效,為甘蔗遺傳背景的鑒定提供了重要的策略。

此外,研究人員通過對染色體基數(shù)為x = 8,x = 9 和x = 10的細莖野生種群體進行遺傳多樣性分析揭示了細莖野生種的倍性是獨立演化的,并且x = 8的群體沒有經(jīng)歷人工選擇。通過對細莖野生種有效群體大小分析表明,細莖野生種群體在12 ~ 14萬年前的有效群體大小達到了最大值,而在0.8 ~ 1.4萬年前經(jīng)歷了群體瓶頸效應(yīng),可能與當時全球氣候經(jīng)歷“新仙女木”事件有關(guān)。最后,該研究系統(tǒng)總結(jié)了細莖野生種群體的演化規(guī)律,并提供了細莖野生種遺傳背景的演化模型。

圖6. 割手密群體的進化

a. 基于二代reads比對的覆蓋度對不同染色體基數(shù)進行判定;
b. 102份細莖野生種重測序材料的遺傳背景;
c. 不同染色體基數(shù)亞群的連鎖不平衡分析;
d. 割手密群體的種群演化歷史;
e.割手密不同染色體基數(shù)的演化;

研究通過利用基因組學(xué)手段系統(tǒng)闡明了甘蔗細莖野生種的起源、遺傳背景及群體歷史,深入挖掘了關(guān)鍵性狀相關(guān)基因的演化,將會全面加強甘蔗野生種種植資源的保護與利用和推動甘蔗全基因組輔助育種。

張積森教授團隊長期從事甘蔗基因組學(xué)與分子育種研究,該成果是基因組中心團隊在甘蔗領(lǐng)域發(fā)表的第二篇《自然遺傳學(xué)》研究論文,這兩篇研究論文是近60年以來甘蔗研究領(lǐng)域發(fā)表的刊物級別最高的論文。

附:評論二則

田志喜 研究員(中國科學(xué)院遺傳與發(fā)育生物學(xué)研究所

多倍體一般分為兩大類:同源多倍體和異源多倍體。普遍認為,同源多倍體是由同一物種內(nèi)的全套染色體的復(fù)制產(chǎn)生的。由于多倍體的基因組分析極具挑戰(zhàn)性,尤其是同源多倍體,因此對同源多倍體基因組進化的研究與異源多倍體相比要少得多。甘蔗細莖野生種染色體數(shù)目變化范圍可從40條到128條,這種廣泛的差異與其倍性水平(4x-16x)和基礎(chǔ)染色體數(shù)(x = 8, 9, 10)有關(guān),是研究多倍體進化的優(yōu)秀材料

福建農(nóng)林大學(xué)海峽聯(lián)合研究院基因組中心張積森團隊長期開展甘蔗基因組學(xué)等基礎(chǔ)生物學(xué)研究。2018年該團隊解析了一個同源八倍體甘蔗細莖野生種SES208(2n= 8x = 64)的單倍體基因組——AP85-441(1n= 4x = 32),發(fā)現(xiàn)其基礎(chǔ)染色體數(shù)為8,相關(guān)結(jié)果發(fā)表在《自然-遺傳學(xué)》期刊。雖然該工作開創(chuàng)性解決了在同源多倍體中解析等位基因這一具有挑戰(zhàn)性的技術(shù)問題,但關(guān)于同源多倍體在甘蔗屬中是如何進化的關(guān)鍵問題仍不清楚。在本研究中,作者組裝了一個基礎(chǔ)染色體數(shù)為10的野生同源四倍體甘蔗細莖野生種Np-X基因組(2n = 4x = 40),該基因組代表了野生甘蔗的祖先核型。在此基礎(chǔ)上,研究團隊收集并重測序了116份甘蔗材料(測序總數(shù)據(jù)量為4682 Gb),探究了細莖野生種的起源和確切的染色體演化模式。該研究發(fā)現(xiàn):

  1. 通過對細莖野生種Np-X和細莖野生種AP85-441的比較基因組學(xué)分析,特別是與古復(fù)制染色體對(PdCPs)相關(guān)的基因組學(xué)比較,作者發(fā)現(xiàn)甘蔗染色體不同倍性的演變是經(jīng)過了裂變和融合的過程,重組斷點位于NpChr5和NpChr8的著絲粒上,該演變過程大約發(fā)生在80萬年前。

  2. 通過基因組3D結(jié)構(gòu)分析,作者有意思地發(fā)現(xiàn)A區(qū)室(活性區(qū))/ B區(qū)室(非活性區(qū))分類在同源染色體上的等位基因之間并不是完全保守的,暗示在同源多倍體中,同源染色體之間雖然高度共線,但染色質(zhì)結(jié)構(gòu)可能存在高度多樣化。此外還發(fā)現(xiàn),在細莖野生種中,PdCPs的位點可能抑制了染色質(zhì)從非活性狀態(tài)向活性狀態(tài)的轉(zhuǎn)換,表明染色體數(shù)目的減少可能在基因調(diào)控中發(fā)揮了重要的作用。

  3. 根據(jù)群體遺傳學(xué)的分析結(jié)果,作者將收集到的細莖野生種材料分為了4個亞群,這4個亞群的地理位置從印度次大陸到東亞和南亞連續(xù)分布。這4個亞群起源于多樣性中心印度(group1),隨后擴散到了group2,group3,group4亞群所在的地區(qū)。group1所含樣本的基礎(chǔ)染色體數(shù)包括x = 8、9、10三種類型;group2,group3,group4亞群中的樣本的基礎(chǔ)染色體數(shù)都以x = 8為主。結(jié)合reads比對的方法,作者推斷出甘蔗基礎(chǔ)染色體數(shù)的變化是一個逐步的過程,即從x = 10到x = 9再到x = 8,明確了甘蔗的染色體演化模式。

  4. 此外,作者還發(fā)現(xiàn)在甘蔗細莖野生種中,三種不同基礎(chǔ)染色體數(shù)的亞群獨立地從祖先進化。大約在120~ 140 Kya,細莖野生種群體經(jīng)歷了有效群體(Ne)的擴張(Ne ~ 500,000),隨后在8 ~ 14 Kya又經(jīng)歷了Ne收縮(Ne ~ 10,000~ 60,000)。作者鑒定到一些在各亞群之間表現(xiàn)出差異的選擇清除區(qū)域,這些區(qū)域可能與染色體減少過程中的多糖代謝和脅迫耐受相關(guān)。在現(xiàn)代甘蔗品種中,這種適應(yīng)性可能有助于塑造甘蔗細莖野生種作為逆境抗性遺傳供體的角色。

  5. 作者對甘蔗重要農(nóng)藝性狀相關(guān)的基因家族進行了分析,發(fā)現(xiàn)與糖積累相關(guān)的基因家族中,INV基因的擴張可能是高糖甘蔗進化的先決條件;并且在Np-X和AP85-441兩個細莖野生種中,與C4光合途徑高度相關(guān)的NAD-ME基因家族成員均發(fā)生了擴張,但在高貴種中沒有此發(fā)現(xiàn)。此外,作者還發(fā)現(xiàn)了可能解釋不同甘蔗種質(zhì)間葉片寬度差異的功能候選基因。該分析為解析甘蔗關(guān)鍵農(nóng)藝性狀的遺傳機制奠定了重要的基礎(chǔ)。

該研究首次系統(tǒng)解析了甘蔗細莖野生種種質(zhì)資源的演化,極大地提高了對同源多倍體基因組進化以及甘蔗生物學(xué)的認識,是甘蔗基礎(chǔ)研究領(lǐng)域的一個里程碑式的進展,對甘蔗從頭雜交育種具有十分重要的理論指導(dǎo)意義。該研究也為多倍體植物的演化提供了先驅(qū)性的研究榜樣,引領(lǐng)未來多倍體植物的基因?qū)W研究。

黃學(xué)輝 教授(上海師范大學(xué)

與小麥、棉花、香蕉等百萬年前產(chǎn)生的天然多倍體不同,現(xiàn)代栽培種甘蔗是在一百年前由八倍體的熱帶種(2n = 8x = 80)與細莖野生種甘蔗反復(fù)雜交產(chǎn)生的。熱帶種甘蔗核型固定并且遺傳背景狹窄,因而目前難以從熱帶種種質(zhì)資源中去拓展現(xiàn)代栽培種甘蔗的遺傳多樣性。細莖野生種甘蔗地理分布廣泛,為現(xiàn)代栽培種甘蔗貢獻了抗逆、分蘗等優(yōu)良性狀。甘蔗細莖野生種倍性和染色體基數(shù)的廣泛變異,是甘蔗育種最為重要的種質(zhì)資源,為研究植物同源多倍體基因組的進化提供了一個極為有趣的模型。

福建農(nóng)林大學(xué)張積森課題組組裝了甘蔗細莖野生種天然同源多倍體基因組。由于同源多倍體的分型組裝至今還是一個基因組研究的難題,因而作者在分型組裝的基礎(chǔ)上,還基于Ultra-Long reads以分段滑窗方式對基因組組裝質(zhì)量進行了獨立驗證,這是對現(xiàn)有多倍體基因組組裝策略的創(chuàng)新性補充。細莖野生種甘蔗存在三種基礎(chǔ)染色體數(shù):x = 8, x = 9,x = 10。通過比較基因組學(xué)分析,作者證實了他們組裝的Np-X(x = 10)是保持祖先核型的甘蔗細莖野生種。

應(yīng)用這個祖先核型的基因組,他們揭示了一系列有意思的“近期”演化事件:

1)甘蔗細莖野生種的染色體分裂整合的斷點是在著絲粒區(qū)域,并且著絲粒再重組過程是帶有著絲粒結(jié)構(gòu)的染色體片段融合入另外一條完整的染色體,導(dǎo)致x = 8的細莖野生種出現(xiàn)“雙著絲粒”現(xiàn)象。著絲粒序列高度復(fù)雜,該項工作可能是首次在植物中揭示了“雙著絲?!钡难莼录?/strong>。

2)重組的染色體是一對ρ事件復(fù)制的古染色體對,存在劑量冗余,其中5號染色體上的基因表達相對于其他染色體明顯受到了抑制。而該染色體對上存在大量的NBS-LRR基因,并且這對古復(fù)制的染色體對在水稻、高粱等作物中也完整保留著,在其他作物中是否存在類似的現(xiàn)象是禾本基因組學(xué)的重要科學(xué)問題。

3)種內(nèi)重組的染色體會促進失活染色體區(qū)室(B-compartment)的形成,對植物種內(nèi)“近期”演化的研究具有重要的參考價值。

4)甘蔗屬的分化低于1.6百萬年,其多倍體也是“近期”事件,約為0.8百萬年內(nèi)。此外,作者對甘蔗屬兩個核心原始種——細莖野生種和熱帶種進行了系統(tǒng)的基因組學(xué)比較,鑒定了一系列兩個甘蔗種“近期”獨立分化的且與糖分代謝、生物量、光合等相關(guān)的基因,為甘蔗的分子輔助育種提供了重要的理論指導(dǎo)。

細莖野生種在染色體數(shù)目上具有很大的差異,從2n = 40到2n = 128不等,基因組倍性水平也從4倍到16倍不等。作者通過100多份代表性的細莖野生種材料的群體基因組學(xué)研究,揭示了細莖野生種的倍體是獨立起源的,提出印度北部是甘蔗細莖野生種的起源中心;作者巧妙應(yīng)用祖先核型的染色體比對二代測序數(shù)據(jù)覆蓋特征,鑒定了群體中x = 8, x = 9,x = 10的材料;并闡明了甘蔗細莖野生種是經(jīng)過5號染色體先斷裂,再經(jīng)8號染色體的演化和整體多倍體化的過程;對基礎(chǔ)研究x = 8的群體環(huán)境適應(yīng)性的優(yōu)勢做了基因組學(xué)解析。這一系列研究,有望為甘蔗種質(zhì)資源的開發(fā)和利用提供理論指導(dǎo)。

此外,多倍體化是植物進化的重要動力之一,多達70%的開花植物是多倍體化后不久產(chǎn)生的。由于已發(fā)布的同源染色體水平的基因組較少,之前基因組信息的缺乏阻礙了同源多倍體基因組進化的研究。張積森課題組的甘蔗細莖野生種研究是同源多倍體研究的先驅(qū)工作,將引領(lǐng)多倍體基因組學(xué)的發(fā)展。

直播問題回復(fù)

1. 張老師,您可以分享一下在NG的投稿經(jīng)歷嗎?
答:這是一家之言,投稿方式經(jīng)歷是多種的。投稿初,第一步Cover Letter的內(nèi)容是非常重要的,針對基因?qū)W的研究,一定得注意基因組只是一個生物學(xué)研究工具,不是簡單的目標,要明確解決的科學(xué)問題是什么?科學(xué)創(chuàng)新點在哪里?其次文章的故事要講好,突出自己研究的創(chuàng)新點,要把具有更廣義的科學(xué)意義融入到論文中。

2. 請問同源多陪體的組裝驗證能詳細講一下嗎?
答:我們首先用ALLHiC進行掛載,ALLHiC的結(jié)果會造成同源組染色體間有一條染色體過大,后續(xù)又結(jié)合3D DNA、juicebox以及大量的人工校正對其進行了大量的矯正。

3. HiFi reads的甲基化數(shù)據(jù)在復(fù)雜基因組拼接中有沒有被充分利用,如果沒有的話,技術(shù)困難在哪里?
答:這是一個很好的問題。利用HiFi reads可能會解決我們基因組中5號8號染色體的劑量冗余問題。但是由于重點研究的科學(xué)問題和精力原因,在本次研究中我們沒有使用該數(shù)據(jù)。

4. 不同倍性的材料,建樹的時候怎么放到一起處理的?
答:我們在建樹時沒有對不同倍性的材料單獨進行區(qū)分處理,不同的倍性不會對最后系統(tǒng)發(fā)育樹的pattern造成很大的影響。

5. 基因組分四套是有拆分成4個fa嗎,如何進行群組的劃分呢?后續(xù)群體的參考基因組是選擇單套為參考還是四套為參考的??
答:非常好的問題?;蚪M序列文件是沒有拆分成4個fa文件的。在后續(xù)對參考基因組進行選擇時,要看你研究的科學(xué)問題。例如在做同源多倍體雜交后代的分離時,建議先選擇用單套參考基因組;在對等位之間的水平差異進行比較時,建議選擇用全套參考基因組。我認為,對于多倍體基因組,代表性單套和同源多倍體的參考基因組要結(jié)合起來使用。

6. 基因組數(shù)據(jù)什么時候公布?
答:基因組數(shù)據(jù)已經(jīng)釋放。在NCBI和我們的甘蔗數(shù)據(jù)庫網(wǎng)站(http://sugarcane.zhangjisenlab.cn/sgd/html/download.html)上都可以進行下載。

7. 張老師,您好,請問有關(guān)注到ASE對性狀的影響嗎?
答:我們十分關(guān)注這個問題,但目前在甘蔗里,還沒有看到哪個ASE直接對性狀有影響。其中甘蔗里有個BRU1基因,是單劑量的抗銹病基因,但不是一個ASE。我們2018年的NG文章中(Zhang et al, nature Genetics,2018),有個章節(jié)專門講了ASE在甘蔗這樣的同源多倍體的特征。如果深入的研究關(guān)聯(lián)性狀,是要有ASE遺傳分離群體。

8. 在群體分析不同染色體倍性基數(shù),生成變異文件,是都比對到一個基因組上call snp 時候是單純簡化成二倍體還是按照倍性設(shè)置不同參數(shù)?
答:都是按二倍體的倍性參數(shù)去設(shè)置的,這里主要有兩個方面的原因:
1)目前沒有針對多倍體開發(fā)的相關(guān)變異檢測軟件,雖然GATK能設(shè)置倍性參數(shù),但是只是針對參考基因組是單倍體,重測序的基因組為多倍體的情況,本研究中的參考基因組是四倍體,故沒有設(shè)置倍性參數(shù)。
2)還有一個重要的原因是甘蔗細莖野生種的群體是存在倍性變異的,如果要根據(jù)重測序基因組的倍性去設(shè)定倍性參數(shù),后續(xù)的分析標準無法統(tǒng)一,無疑會讓分析工作無法開展下去。

9. 老師您好,針對倍性這么復(fù)雜的甘蔗,存在很多比對到多個位置的reads,那么如何準確獲得到SNP基因型?
答:您關(guān)注的這個問題很重要,也確實存在,但是目前也很難去完全避免這種情況發(fā)生,我們?yōu)榱颂岣咦儺悪z測的準確性,采用了bowtie2進行mapping,采用了GATK進行SNP calling。

10. 請問群體數(shù)據(jù)也和基因組數(shù)據(jù)一起公布了呢?
答:基因組數(shù)據(jù)已釋放。群體的數(shù)據(jù)有4T多,我們正在上傳中,可能會稍微慢一些,如果您需要,可以隨時聯(lián)系以硬盤拷貝的方式郵寄給您

11.甘蔗屬于高雜合高重復(fù)的多倍體嗎?
答:是的,栽培種甘蔗屬于高雜合高重復(fù)的同源多倍體,這個重復(fù)主要是多倍體。整個基因組的序列重復(fù)比例是正常,約為60%左右。

12. 請問張老師,甘蔗的雜合度和重復(fù)序列怎么樣?
答:Np-X的雜合度約為1.27%,重復(fù)序列的比例約為57.52%(附件中有列表)。

13. 割手密的5號和8號染色體在現(xiàn)代甘蔗品種中是否是保守的,還是存在很大的變異?
答:現(xiàn)代甘蔗品種是由兩個原始種雜交產(chǎn)生,對應(yīng)的5號和8號染色體是比較復(fù)雜的。現(xiàn)代甘蔗基因組中來自高貴種的5、8號染色體保持祖先核型,而來自割手密中5、8號染色體是斷裂重組的?,F(xiàn)代甘蔗的5號和8號可能存在比別的染色體更大的變異,目前我們還在研究中。

14. fish實驗是自己做的,還是公司做的呢?
答:這是要設(shè)計整個染色體水平oligo探針,要有甘蔗的參考基因組,是由我們團隊自己完成,具體是文章作者里的黃永吉、鄧祖湖等老師做的。這個項目中,除了測序由北京百邁客等公司完成,所有分析、實驗工作都是我們團隊完成的。

15. 請問同源多倍體中,嵌合版本的單套基因組是否還有組裝的必要?
答:一般來說還是建議組裝出一套單套的monoploid基因組進行備用。個別分析項目可能會用到monoploid基因組,比如鑒定單倍體水平的變異等。

16. 老師您測序的甘蔗熱帶種或者商業(yè)品種的基因組數(shù)據(jù)什么時候能發(fā)布?
答:熱帶種的基因組已有個版本,在我們的網(wǎng)站是有的,但組裝上存在不足,我們還在優(yōu)化。栽培種的基因組十分復(fù)雜,已做了5年,但我們還不是不滿意。希望這兩個在今年年底能發(fā)布。

17. 我想問一下老師甘蔗的同源多倍體是用什么方式獲得的?
答:同源多倍體化是自然界中非常常見的現(xiàn)象,絕大部分的生物的進化歷程都是進行多倍體化后形成多倍體,然后同源組內(nèi)進行分化、染色體重排等,逐漸走向二倍體,這種過程在漫長的歲月里周而復(fù)始的進行著,從而幫助生物體更好地適應(yīng)外界環(huán)境。而同源多倍體形成的方式主要是在減數(shù)分裂時期分裂過程異常發(fā)生導(dǎo)致的。

18. SV除了可以進行功能基因定位,可以常規(guī)的遺傳進化分析嗎,比如群體結(jié)構(gòu),主成分等?
答:可以將結(jié)構(gòu)標記理解為一個變異,基于變異標記可以進行群體結(jié)構(gòu),主成分等分析

19. GWAS分析,可以只用SV去做嗎?
答:最好結(jié)合SNP,INDEL 分析,可以分開分析,也可以整合到一起分析。

20. Pb-CCS 甲基化,需要測序多少乘,準確性怎么樣?
答:基于Pacbio官方測評數(shù)據(jù),推薦10-15x,即可滿足甲基化分析,同時還可以開展結(jié)構(gòu)變異挖掘。Pb-CCS 和ONT,二代WGBS比較,準確性在90%以上。

21.萬一三種功能基因定位方法不一致怎么辦?
答:三種功能基因定位方法不一致,這是很正常的現(xiàn)象。老師重點關(guān)注一下是位置存在偏差,還是定位的區(qū)域本身就相差很大。

  • 如果是第一種,其實也是共同定位到了,只是相應(yīng)統(tǒng)計方法可能存在偏差,建議老師稍微放大區(qū)域。
  • 如果是第二種,定位結(jié)果本身就不一樣,老師可以將每種方法的結(jié)果基于顯著水平進行觀察,先去關(guān)注最顯著的,有條件的話,每個都去驗證一下。

22. 基因組版本轉(zhuǎn)化軟件除了liftover還有哪些呢?
答:UCSC liftOver, NCBI Remap, Ensembl API都有涉及坐標轉(zhuǎn)化。

文章鏈接:

https://www.nature.com/articles/s41588-022-01084-1

https://mp.weixin.qq.com/s/tB3YWvXg_QMK6aabE5--fg
https://mp.weixin.qq.com/s/GXGf1c8rhcq_HGTBkf4XaQ
https://mp.weixin.qq.com/s/zZSWT_04aBtqcQa9Q4LemA
https://mp.weixin.qq.com/s/X4jWqJrS3xdynPjg6b0fHA
https://mp.weixin.qq.com/s/GXGf1c8rhcq_HGTBkf4XaQ

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容