導讀
馬鈴薯(Solanum tuberosum)是消費最多的非谷類糧食作物。大多數商業化的馬鈴薯栽培品種為同源四倍體,具有高度雜合的基因組,嚴重阻礙了遺傳分析和改良。利用最先進的測序技術和多倍型圖形binning,此研究完成了一種馬鈴薯栽培品種Cooperative-88(C88)的染色體規模的單倍型分型基因組組裝。單倍型內比較分析顯示,該四倍體基因組具有廣泛的序列和表達差異。此研究在染色體上發現了單倍型特異性的-近端著絲粒,這表明馬鈴薯同源著絲粒的進化軌跡是不同的。此外,在1034個自交子代中的1021個個體中發現了在單倍型上不均勻分布的雙減數分裂事件,這是同源多倍體遺傳的一個特征。通過區分C88的父本和母本單倍型,此研究模擬了栽培四倍體中-雜種優勢的起源,鑒定了3110個具有有害突變的四等位基因位點,這些座位被雙親在雜合狀態下掩蓋了。此研究為深入研究同源多倍體的基因組結構提供了新的思路,對同源多倍體的育種具有一定的指導意義。
原名:Genome architecture and tetrasomic inheritance of autotetraploid potato
譯名:同源四倍體馬鈴薯的基因組結構和四倍體遺傳
期刊:Molecular Plant
IF:21.949
發表時間:2022年6月
通訊作者:周倩和黃三文
通訊作者單位:中國農業科學院深圳農業基因組研究所
DOI號:10.1016/j.molp.2022.06.009
實驗設計
結果
1. 同源四倍體的單倍型分型基因組組裝
此研究選擇了一種同源四倍體馬鈴薯品種Collication-88(C88)進行測序和基因組組裝。C88是一種抗晚疫病的高產商品化馬鈴薯品種。C88的塊莖呈塊狀,皮色偏紅,肉質呈淺黃色,有淺眼。它是以印度馬鈴薯I1085作為母本,與來自S. tuberosum群體Andigena品種的不明抗枯萎病種質作為父本雜交而得。繼20世紀90年代由國際馬鈴薯中心(CIP)和中國云南師范大學培育后,C88已成為中國西南部的首選品種,并迅速被鄰近省份和其他東南亞國家采用。
2. C88基因組的初步組裝和分型
根據 k-mer 分析和流式細胞術(補充圖1),C88基因組大小估計約為 3Gb。總共獲得了96.2Gb的PacBio HiFi reads,具有32 倍的基因組覆蓋度(補充表1)。HiFi reads是使用hifiasm組裝的,產生了3.08Gb大小的基因組,unitig N50長度為1.45Mb(組裝版本0.1,以下簡稱C88.v0.1)(圖1A)。接下來,此研究利用Hi-C數據和單倍體參考基因組,試圖將unitigs分配到不同的單倍型組,該方法已經成功地在栽培苜蓿(Medicago sativa L.)和甘蔗(Saccharum spontaneum L.)的同源四倍體基因組進行了研究。然而,由此產生的組被認為不能很好地代表C88基因組的單倍型。將HiFi reads映射到這些unitigs上,在C88.v0.1中發現2.61Gb的haplotigs,其中325.68Mb 未被組裝到染色體上的diplotigs (2×)和triplotigs (3×)呈現出顯著的2倍和3倍reads覆蓋度(補充圖2A)。此課題組之前基于單倍型感知基因圖譜,開發了1種從二倍體馬鈴薯基因組中進行haplotig分型的方法。這里,為了使用四倍體遺傳圖譜對C88 haplotigs進行分型,此研究利用四倍體遺傳圖譜將1034個S1子代的重測序reads映射到C88.v0.1的基因組組裝上,并計算了子代中每個unitig的遺傳劑量(0、1、2、3、4)(補充圖2B)。通過劑量評分的遺傳分組,約2.08Gb的haplotigs構建了48個組,代表了12條染色體的4種單倍型。根據劑量評分,將組裝失敗的2×、3×區域分解為2個或3個相同的拷貝,共有737.09 Mb的haplotig序列,并根據其與分組的haplotig的連鎖關系劃分到48個組(補充表2;補充圖3和4)。
圖1|同源四倍體馬鈴薯基因組的單倍型分型基因組組裝。
A 分型基因組組裝過程的示意圖。
B同源四倍體基因組組裝C88v1的圖譜。左上角的線形圖顯示了同源四倍體基因組組裝,并在graph binning中提供了連鎖分組信息。彩色節點表示來自4種單倍型的組裝序列,長度按序列的實際長度縮放。對角線上的點圖顯示了C88.v1組裝與單倍體馬鈴薯參考基因組DM v6.1之間的比對。
C C88基因組的序列組成。Haplotig、diplotig、triplotig和tetraplotig是通過以下規則定義的:組成它們的HiFi reads被分別使用1次、2次、3次和4次。右邊的數字表示1-12號染色體。x軸上的數字表示以Mb為單位的染色體長度。該分析是基于C88.v1的組裝中產生的圖形片段組裝文件。
3. C88基因組分型輔助多倍體圖形binning
根據分組的unitigs(圖1B),89.7%的不連續HiFi reads(未被其他長reads覆蓋的reads)被分配到48個單倍型,分型信息被輸入到hifiasm的polyploid graph binning中。在之前的hifiasmgraph binning實驗中,三倍體信息用于改善二倍體基因組內雜合區域的組裝。在目前的研究中,此研究首次將這一應用擴展到同源四倍體基因組,方法是將pre-phased的HiFi reads輸入到hifiasm。在hifiasm運行后,得到了四組總大小分別為954.57Mb、918.61Mb、900.16Mb和894.06Mb的contigs(以下簡稱H1、H2、H3和H4)。對于每組,通過使用Hi-C數據對contigs進行聚類和排序來生成12條染色體。在去除質粒和冗余序列(補充圖5)后,獲得了單倍型分型的C88組裝體(C88.v1),總尺寸為3.15Gb,contig N50長度為18.78Mb,3.03Gb序列被錨定到48條染色體上(表1),其中檢測到44個端粒(圖1B和補充圖6和補充表3)。
4. 單倍型分型基因組組裝的評估
使用6種獨立分析評估C88.v1的單倍型完整性和準確性:
(1) k-mer分布顯示,組裝失敗的序列在C88.v1中被分型(補充圖7)。HiFi reads的均勻分布映射覆蓋度也支持單倍型分型特性(補充圖7)。
(2) 為了評估分型精度,此研究基于ONT UL(Oxford Nanopore Technologies Ultra Long) reads,使用Whatshap polyphase構建了分型區塊。在66370個分型區塊中,含有3400173個單核苷酸多態性(SNPs),分型區塊和4種組裝的單倍型之間的一致性分別為97.86%(H1)、98.58%(H2)、97.96%(H3)和98.58%(H4),表明分型組裝和由UL reads產生的局部分型之間的高度一致性。
(3) 為了驗證結構的正確性,此研究檢測了C88.v1和單倍體馬鈴薯參考基因組DMv6.1之間的結構變異(SVs),長度范圍為50kb至200kb,并手動檢查了SV區域UL reads的映射。只有映射長度為>100kb的UL reads被用于分析。在有3個以上UL reads覆蓋的179個SVs中,97.7%的SVs被斷點處的UL reads所跨越。
(4) 使用Illumina數據,此研究確定的最終組裝具有非常高的堿基精度(質量值,QV 46.6)和完整性(99.05%)。
(5) 利用單拷貝同源基因基準(Benchmarking Universal Single-Copy Orthologs,BUSCO)對組裝的分析確定了每種單倍型中存在超過97%的完整基因,其中只有不到3%的重復基因,表明單倍型完整性(表1)。
(6) scaffolds的遺傳連鎖強度和Hi-C連接矩陣也支持了分型組裝的質量(補充圖6和8)。
總的來說,C88的單倍型分型基因組組裝相對完整,具有解壓縮的純合子區域,包含4組單倍體基因組基因,在SNP分型和大規模結構上具有較高的準確性。根據來自20個組織的239331個PacBio全長轉錄本和162Gb Illumina RNA測序(RNA-seq)數據,預測了C88基因組中的150853個蛋白質編碼基因和217651個亞型(補充表4)。另外,在C88基因組中鑒定了2262個潛在的核苷酸結合位點富含亮氨酸的重復序列(NBS-LRR或NLR)基因,構成165個聚類,其中染色體4、5和11占所有聚類NLR基因的51.11%(補充圖9)。BUSCO對基因注釋的評估表明,每個單倍型中有93.8%~95.3%的完整基因,合并的基因組中有99.2%的完整基因(表1)。此外,來自20個組織的RNA-seq數據的平均映射率為93.11%。
5. 同源四倍體馬鈴薯基因組中的單倍型之間的多樣性
5.1 序列差異: SNPs、InDels和SVs
為了對基因組內多樣性進行全基因組評價,此研究選擇每條染色體上最長的單倍型來組成C88的偽單倍體基因組。基于分型HiFi reads比對,在4種單倍型中共檢測到11964627個SNPs和1056892個小的插入/缺失(InDels),它們不均勻地分布在12條染色體上,大約相當于偽單倍體基因組的1.86%(圖2A)。
主成分分析表明,第2、4、9和11號染色體的單倍型之間的距離較均勻,而第1、3、5、6、7、8、10和12號染色體的單倍型聚為2或3類。單倍型之間的局部差異水平也各不相同,在某些區域的差異顯著降低。以11號染色體為例,PCA分析顯示4種單倍型雖然分離,但chr11_1與chr11_4在17-38Mb處非常相似,而chr11_2和chr11_3在19-33Mb處序列一致性較高。此外,chr10_2、chr10_3和chr10_4共有37.2Mb的單倍型序列,在組裝過程中出現三倍體組裝失敗區域,但在10號染色體近端2個區域的多樣性水平為7.58 SNPs/kb。
單倍型之間存在/缺失變異(PAV)的基因有11097個,SVs有50360個,其中大的SVs有431個(>100kb),影響了902.76Mb的序列。此研究還在7號染色體上獲得了一個900kb共線區域的放大圖,以說明4種單倍型之間的廣泛分離(圖2B)。
圖2|C88基因組內單倍體之間的多樣性。
A 散點圖顯示4個同源單倍型的PCA,以及它們之間的相對距離。熱圖在1 Mb窗口中顯示任意2個單倍型之間的SNP/InDels密度。熱圖左側的數字1–6表示2個比較的單倍型。黑色短線標記低可映射區域。
B 單倍體之間的多樣性示意圖,顯示了7號染色體上~900kb區域的同源區域(灰色),同源基因(大寫字母),SVs(深橙色),PAV基因(天藍色)和差異表達基因(顯性、平衡和抑制)。與chr7_3和chr7_4相比,在chr7_2上插入~400kb序列,在該單倍型中增加了16個額外的基因。灰度圖表示共線區域中的變量一致性。
C 上圖:使用1kb窗口,將1號染色體上共線性低的區域重新進行比對。所涉及的區域為chr1_1:18.48–55.57Mb、chr1_2:18.86–48.81Mb、chr1_3:17.44–42.59Mb和chr1_4:16.49–49.40Mb。下圖:1號染色體重復序列的突出顯示(chr1_1:34.48–40.48Mb,chr1_2:29.88–32.38Mb,chr1_3:26.99–28.44Mb,chr1_4:26.99–40.99Mb)。
5.2 近端著絲粒和著絲粒區域的可變重復序列
將HiFi reads映射到偽單倍體基因組并對4種單倍型進行共線性分析時,一些區域幾乎沒有被同源單倍型覆蓋。這些區域的長度從0.8Mb到37.1Mb不等。根據它們在染色體上的位置,此研究認為它們可能含有著絲粒,并將6個從單倍體馬鈴薯基因組中鑒定出來的著絲粒重復序列(St18、St24、St49、St57、St3-58和St3-238)與這些區域進行比對。24個目標單倍型中的有14個觀察到重復陣列的顯著富集,其長度從19kb到4.5Mb不等(補充表5),這表明著絲粒的位置。在1號染色體上,St24分別在chr1_2、chr1_3和chr1_4上形成99kb、4.6kb和4.5Mb重復序列,而在chr1_1上沒有觀察到重復序列。在5號和6號染色體上,僅在4種單倍型中的1種上檢測到重復富集。
為了充分了解48個單倍型上的近端著絲粒和著絲粒區域,此研究使用1kb窗口,利用StainedGlass對缺乏共線性的區域進行了重新比對,并確定了單倍型特異性的、百萬堿基大小的重復序列。根據高度重復的富集程度,48個單倍型可分為3種類型,即與同源基因共享重復序列的單倍型、攜帶唯一重復序列的單倍型、以及沒有明顯重復序列的單倍型。chr1_1有2個特異的重復序列,占3.69Mb區域,而chr1_4、chr1_2和chr1_3共享2個重復序列,長度分別為1.43Mb、1.61Mb和1.28Mb(圖2C和補充圖10)。除3號染色體外,在所有染色體上都檢測到單倍型特異性重復序列,其中4個單倍型共享2個重復序列。與擬南芥和水稻的基因組不同,它們含有高度相似的著絲粒衛星重復序列,同源四倍體馬鈴薯基因組在同源單倍型上表現出明顯的近端著絲粒和著絲粒特征,表明了著絲粒序列的快速進化。
5.3 野生馬鈴薯基因在栽培C88基因組中漸滲
野生物種的入侵被認為增加了栽培作物品系的雜合性。通過將HiFi reads(源自最近發布的馬鈴薯泛基因組計劃中的20個二倍體野生馬鈴薯)映射到C88基因組,此研究確定了C88單倍型與這些野生型基因組之間不同程度的相似性。野生馬鈴薯的reads覆蓋了C88基因組的25.52%,覆蓋率超過20×,這意味著野生種質可能存在嚴重的漸滲現象(補充圖11)。在單倍型chr1_1、chr2_1、chr4_1、chr4_3、chr4_4、chr5_2、chr7_2和chr9_3中,推定的漸滲區域占據了這些單倍型的50%以上(補充表6和7)。在檢測到的35個著絲粒樣重復序列區域中,有30個區域與推定的漸滲區域重疊,這表明野生馬鈴薯序列可能與C88單倍型的獨特的著絲粒有關。
5.4 等位基因差異表達
為了揭示4種單倍型上同源基因的表達譜圖,此研究在單倍型間的共線區塊中鑒定了23086個四等位基因位點,每個單倍型有一個等位基因,并分析了它們在20個組織中的表達。對于每個組織,此研究根據4個等位基因的相對表達水平將等位基因的表達分為平衡、顯性和抑制表達(補充圖12A)。平均而言,在1個組織中,49.1%的四等位基因位點在4個等位基因中表現出差異表達,其中3.4%的位點具有單個顯性表達等位基因(補充圖12B)。就表達而言,對特定單倍型沒有顯著的偏好。在C88基因組中,此研究觀察到1個位點的等位基因在20個組織中表現出不同的表達模式。在92344個等位基因中,23086個位點中的61.7%(56942個)在20個組織中顯示出至少2種表達類型,表明同源四倍體馬鈴薯基因組基因表達具有動態特性。
6. 同源四倍體馬鈴薯基因組中的四倍體遺傳
在同源多倍體減數分裂中,二倍體和異源多倍體的遺傳有許多明顯的特征,例如染色體的多價配對和優先配對,以及雙減數分裂(double reduction,DR),這些特征長期以來一直是四倍體馬鈴薯和其他多倍體作物的研究熱點。在這項研究中,此研究在C88的自交群體中見證了這些有價值的事件。利用9834個鑒定過基因型的SNPs對1034個S1馬鈴薯四倍體群體進行了二價配對和多價配對頻率的檢測(補充圖13和14)。二價配對與隨機配對無偏差,四價配對在C88自交群體中頻率范圍為50%~70%,顯著高于雜交群體19%的平均頻率。這種差異可能是由于親本系中基因組組分的差異造成的。在多價構型的基礎上,DR的發生取決于減數分裂I期同源染色體的DNA交換,而攜帶相同單倍型的姐妹染色單體在減數分裂II期被吸引到同一極。根據DR在端粒和著絲粒之間的染色體位置,計算出DR的理論發生率為0≤α≤1/6。為了研究同源四倍體馬鈴薯中DR的特性,此研究使用低覆蓋率測序數據對C88的自交系進行了基因分型。盡管在自交系中檢測DRs存在一定的局限性,但此研究仍然觀察到,在1034個測序子代中有1021個個體,其12條染色體上DRs頻率為1%-4%(圖3)。DRs的分布在同源單倍型上有所不同。對于48個單倍型中的32個,DR頻率向染色體的兩個端粒增加,在靠近著絲粒區域檢測到的DR頻率降低,這與先前基于SNP遺傳圖譜的研究一致。然而,在其余16個單倍型上,端粒區域只有1個或沒有DR頻率峰。以7號染色體為例,chr7_1、chr7_3和chr7_4在1個近端端粒區域出現了DR頻率峰,最高頻率分別為2%、1%和1%,而chr7_2在另一個近端端粒區域出現了2.5%的頻率峰。為了研究4種單倍型的分離,此研究在1034個S1個體中手動選擇了9834個高質量SNPs來推斷群體中遺傳的單倍型(補充圖14)。由于使用低覆蓋度的基因組測序數據很難推斷單個單倍型,此研究中,每個單倍型的覆蓋度為~1×,由PolyOrigin推斷的4種單倍型的比例具有明顯的參考偏差;也就是說,在reads映射過程中用作參考的單倍型在子代中以較高的比例計算。盡管如此,仍然觀察到明顯的分離偏差,如一些單倍型的比例遠遠低于理論上的1/4(χ2檢驗,P<10-10),如chr3_3、chr4_3、chr6_3、chr8_3和chr12_2上的區域。這些單倍型比例的降低可能是存在影響較大的有害突變的結果。
7. 栽培四倍體雜種優勢起源的評估
多倍體被認為與馴化密切相關,并通過提供更有利的基因和遺傳多樣性來促進作物的早期馴化,這有利于增加適應性。四倍體馬鈴薯起源于地方品種二倍體中2n配子的雜交。為了研究多倍體對現代馬鈴薯品種發育的影響,此研究利用親本單倍型組合,在C88基因組中模擬了2個2n配子的雜交。對C88母本I-1085的基因組進行測序,并使用母本特異性純合SNPs將C88基因組的48條染色體分成2組親本單倍型(補充圖15)。像許多其他無性繁殖作物一樣,馬鈴薯攜帶著沉重的突變負擔。在C88基因組中,此研究預測了4種單倍型上的57641個功能性有害突變,影響了15942個注釋基因,稱之為預測有害等位基因(PDA)。在總共23086個四等位基因位點中,33.05%含有1~3個PDAs,使PDAs保持在雜合狀態(圖4A)。與23.0%的雙等位基因位點具有雜合PDAs的二倍體馬鈴薯單倍型相比,四倍體馬鈴薯單倍型通過提供更多的基因拷貝作為缺陷等位基因的備份,表現出更高水平的功能互補。就親本單倍型而言,在744個四等位基因位點中,2個母本等位基因都是PDAs,而父本單倍型提供了未受影響的等位基因(圖4B)。相反,有2366個四等位基因位點具有2個父系PDAs和至少1個未受影響的母體等位基因。因此,在雜交中,配子中的2個功能失調的等位基因會在四倍體合子的雜合狀態下被另一親本掩蓋。在同源多倍體過程中,2n配子上的純合有害突變將以這種方式被掩蓋,從而減少了有害突變積累的有害影響。這可能是利于四倍體品種存在的基礎。在C88基因組中,此研究檢測到1079個父系特異性基因和1253個母系特異性基因。親本雜交賦予四倍體更為豐富的遺傳多樣性,為篩選育種中累積的優良性狀提供了可能。由P. infestans引起的晚疫病是兩個多世紀以來馬鈴薯產量下降最嚴重的疾病。C88對葉子和塊莖中的P. infestans均具有高度的持久抵抗力。Avr蛋白的浸潤實驗表明,Avr1和Avr2在C88馬鈴薯葉子上產生了顯著的超敏反應(HR)表型(補充圖16)。此研究通過構建野生馬鈴薯Solanum demissum的細菌人工染色體(BAC)克隆PGEC472P22,將R1基因定位在chr5_3(圖4C),并使用具有HR表型的全長轉錄本將R2基因定位在chr4_3(補充圖16)。R1和R2均來自父系單倍型,表明C88品種的持久抗性在很大程度上歸因于其父本S. andigena。C88主要作為夏季作物種植在云南省,位于北緯20℃-30℃,夏季日照時間較長。在這種條件下,C88母本品種I-1085具有更好的適應性,而Andigena的適應性較差。C88夏季成熟較晚,生長期為120-150天。對馬鈴薯晚熟基因StCDF1.1的篩選顯示,4個等位基因中有3個是相同的,1個等位基因在編碼序列(CDS)中有3-bp的缺失,導致1個氨基酸缺失,在3個預測結構域之外,這似乎不太可能影響基因功能(圖4C)。因此,來自2個親本的StCDF1.1的4個等位基因可能賦予了C88在較長的日照條件下的晚熟表型,確保其在亞熱帶地區的適應性。親本單倍型功能基因的積累使C88成為適應性強、成熟期晚、抗性持久的優良品種。
A 具有0、1、2、3、4個PDAs的四等位基因座的比例(左餅圖)和具有功能互補等位基因的位點數量(右餅圖)。
B 母本(青色)和父本(橙色)單倍型上未受影響的等位基因的數量。這些數字是在1Mb窗口中計算的。
C 因為在5號染色體的4種單倍型(母體[青色]和父系[橙色])中均存在1個SV,因此,來自S. demissum BAC的R1位點僅定位于chr5_3;C88基因組中有4個StCDF1.1等位基因(右)。
討論
長期以來,同源四倍體馬鈴薯基因組的可獲得性因其高度雜合而受到阻礙,從而妨礙了雜種優勢的遺傳基礎的表征、潛在的理想性狀以及對同源四倍體物種的基因組結構的研究。最近,得益于測序技術的進步,發表了幾個四倍體馬鈴薯的基因組,包括四倍體品種Otava和栽培品種Altus、Atlantic、Avenger、Castle Russet、Colomba和Spunta的染色體規模單倍型分型基因組。
在這項研究中,此研究獲得了一個商業化的同源四倍體馬鈴薯栽培品種C88的基因組組裝體。這些可用的基因組為了解栽培馬鈴薯和其他同源多倍體物種的生物學特征提供了重要資源。Otava和C88的基因組都是通過利用最新的HiFi測序技術完成的,并使用遺傳群體來指導長reads的分型。這兩項獨立的工作之間的區別在于在第二輪組裝中利用了分型reads,這是為了提高初始contigs的連續性。在Otava組裝中,分型reads被分成幾組,然后分別重新組裝到每個組。該策略已成功應用于許多基因輔助組裝。與此不同的是,在C88組裝中,此研究將reads的分型信息輸入到組裝軟件hifiasm中,并應用polyploid graph binning來指導全基因組圖譜的解析并生成新的contigs。Polyploid graph binning是一種更直接的策略,充分利用reads信息,并且不會引入深度偏差。C88基因組的高質量在連續性(18.78Mb vs. 7.1Mb的contig N50)和完整性(98.4% vs. 97.3%的BUSCO評分)方面都優于Otava組裝,證明了polyploid graph binning的有效性。reads的分型信息可以通過多種方式生成,例如連鎖分組或Hi-C分型。然而,C88和Otava基因組為多倍體基因組的單倍型分型組裝提供了令人信服的例子。
在解釋同源四倍體基因組的基因組結構時,單倍型之間不均勻分布的多態性導致了鑲嵌分布的高度分化區域和幾乎相同的區域的出現,這使得分析復雜化。依賴于雙端比對或基于參考基因組比對的常規方法不足以證明其復雜性。為了充分說明復雜的SVs并避免參考偏差,迫切需要基于圖形的泛基因組模型和能夠簡潔地表示同源單倍型的工具。
對單倍型間缺乏共線性的區域進行全局放大比對,結果發現了單倍型特異性重復序列的存在和缺失。這些區域含有未知的著絲粒,表明馬鈴薯基因組中著絲粒的快速動態進化。與A. thaliana和稻屬物種相比,這是一個非常明顯的特征。以往的研究報道了在S. tuberosum和野生馬鈴薯的著絲粒和著絲粒DNA中存在多種重復類型,這對茄屬植物著絲粒的起源和進化提出了尚未解決的問題。最近發表的C88和其他同源四倍體馬鈴薯基因組,加上最新的茄科物種泛基因組,為在更詳細、更廣泛的尺度上研究茄科物種著絲粒的動態變化提供了豐富的資源。
通過對20個野生型二倍體馬鈴薯的基因組reads進行篩選,此研究在C88基因組中發現了805.37Mb的潛在漸滲區域。在40個單倍型上檢測到的165個NLR基因簇中,有98個簇與漸滲區域重疊,這可能解釋了功能性抗性基因的起源。單倍型上NLR基因簇的檢測也有利于目標類型的抗性基因的組合,在育種方案中選擇特定的單倍型,并盡可能將有利漸滲整合到四倍體或二倍體馬鈴薯中。
雖然有害突變在同源單倍型中均勻分布,但在C88基因組中,此研究發現父系單倍型比母系單倍型具有更多的純合子功能失調位點,即兩個等位基因是PDAs,這表明來自不同背景的單倍型可能攜帶不同數量的有害等位基因。對馬鈴薯多相位基因組的進一步分析,為選擇合適的骨干單倍型提供了全面的信息,對基因組設計育種具有重要的意義。