包括在貝葉斯方法中用于基于全基因組標記的遺傳值的預測的非加性遺傳效應
抽象
背景
分子標記信息是繪制關于遺傳和表型變異之間的關系的推論的常見來源。遺傳效應通常被建模為加性作用標記等位基因效應。生物作用的真正模式當然可以不同于這個平常的假設。更好地理解復雜性狀的遺傳結構的一種可能性是包括等位基因的基因座內(顯性)和基因座間(上位)相互作用以及當將模型擬合到性狀時的加性遺傳效應。存在幾種貝葉斯MCMC方法用于遺傳效應的全基因組估計,具有高準確性的遺傳值預測。包括成千上萬個位點的成對相互作用可能超出這種采樣算法的范圍,因為然后將同時估計數百萬個效應,導致幾個月的計算時間。當研究上位性時需要替代性解決策略。
方法
我們擴展了一個快速貝葉斯方法(fBayesB),這是以前提出的純粹的加性模型,包括非加性效應。 fBayesB方法用于在模擬數據集的基礎上估計遺傳效應。模擬不同的情景以研究預測精度的損失,如果上位性效應未被模擬但是被建模,反之亦然。
結果
如果模擬23個QTL以引起加性和顯性效應,則fBayesB和常規MCMC采樣器BayesB在基于包括加性和顯性效應的模型的遺傳值預測和方差分量估計偏差方面產生類似的結果。將fBayesB應用于具有上位性的數據,當所有成對相互作用被建模時,準確度可以提高5%。如果遺傳變異擴散超過230個QTL,精確度降低20%以上。在這種情況下,基于建模只有加性和顯性效應的準確性一般優于包括上位效應的復雜模型。
結論
該模擬研究表明,fBayesB方法對于遺傳值預測是方便的。共同估計加性和非加性效應(特別是顯性)對預測的準確性和分配到加性遺傳來源的遺傳變異的比例具有合理的影響。
1背景
分子標記信息通常用于推斷關于各種物種的遺傳和表型變異之間的關系,例如。人[1],奶牛[2]或小鼠[3]。假設數量性狀基因座(QTL)和標記之間的連鎖不平衡(LD),可以估計遺傳效應并解釋為由鄰近標記捕獲的QTL效應。如果育種值是焦點,遺傳效應通常被建模為加性作用標記等位基因效應(例如[4,5])。生物作用的模式當然可以不同于純加成性的假設。更好地理解復雜性狀的遺傳結構的一種可能性是在將模型擬合到性狀時包括等位基因的基因座內(顯性)和基因座間(上位)相互作用。最近已經研究了非加性效應對遺傳變異的重要性。關于非加性效應的知識對于受益于例如雜種顯性效應[6]是必要的,特別是對于雜交育種方案(家禽,植物等)。通常,可以預期的是,如果對非加性效應進行另外建模,則遺傳值的預測,特別是其加性部分的預測得到改善。例如,Lee等人[7]報道當在小鼠中研究表型涂層顏色(+ 17%的準確性)或CD8 +細胞的百分比(+ 2%的準確性)時,與單純加性遺傳模型相比,當包括顯性效應時,預測的準確度顯著增加。然而,增加的上位性在這種情況下沒有貢獻準確性。在大豆重組近交系的實例中[8],在上位模型下預測的準確度增加了一倍以上。即使非加性效應可能發生在基因作用的水平,當基因處于極端頻率時,大多數遺傳變異可能被賦予加性效應[9]。例如上位性參與調節復雜性狀的程度是未知的,但關于它的知識可以用于推斷生物學機制和重建生物學途徑[10]。 Carlborg等人[11]在關于對雞生長差異的非加性影響的第一個研究中,估計10%的早期生長(性狀Gr18)的遺傳變異是由于顯性,甚至70%由于上位性。這個例子顯示了相互作用位點的重要性,雖然可以假設高估上位性效應,一種已知為單個位點的Beavis效應的現象[12]。由于這個實驗是基于十分不同的線,需要進一步的研究來找到證據的交互基因在純種。
不同的方法可用于模擬加性和非加性遺傳效應。在QTL檢測的方面,可以使用例如方差分量法來進行基因組掃描以揭示遺傳效應[13,14]。如果加性和非加性效應要在整個基因組上同時建模,我們必須知道“p大于n”的問題,意味著有更多的參數比觀察。為了應對一體化的局面,Xu提出了一種貝葉斯方法[15],它與BayesA [4]和一個經驗貝葉斯方法[16]加性劑標記效應。通常用于估計加性效應的貝葉斯方法應用需要大量計算時間的馬爾科夫鏈蒙特卡羅(MCMC)模擬,但是他們在預測遺傳值的準確性方面說服他們。特別地,BayesB方法[4]優于其他方法,例如脊回歸和偏最小二乘[17,18,19]。如果包括進一步的非加性效應,MCMC采樣方法可能在高標記密度下崩潰。作為一種替代方法,貝葉斯方法是可用的,應用分析導出的后驗密度的標記效應,而不是其樣品[20]。這種方法(稱為fBayesB)顯示出略微不太準確,因為在迭代過程中,一次僅研究單個標記物效應,而針對所有其他先前估計的效應校正表型的載體。 fBayesB策略比使用MCMC的傳統貝葉斯方法快得多。這種解決方法提供了另外考慮全基因組相互作用效應和用合理的計算努力來估計它們的可能性。
本研究的目的是探討非加性效應對牲畜種群遺傳價值預測的影響。當加性和非加性效應聯合涉及將模型擬合到性狀時,旨在改進的加性效應的估計和更好的遺傳值的預測。由于旨在估計任意群體中的非加性效應的方法剛剛出現,因此使用模擬來驗證這些方法是特別重要的。因此,通過這項研究,我們追求方法方面,從而組合事實,有助于解釋在實際數據中獲得的結果在未來的工作。我們認為加性,顯性和成對地上位效應捕獲在分布在整個基因組的雙等位基因標記。統計建模的細節在本文的第一部分。我們擴展了快速貝葉斯方法(fBayesB),它是在純加和性下開發的[20],包括非加性效應。 fBayesB用于在類似于奶牛群體的模擬數據集的基礎上估計遺傳效應。模擬不同的情景以研究預測精度的損失,如果上位性效應未被模擬但是被建模,反之亦然。在第二部分,我們總結了分析模擬數據的結果。確定在標志物效應的全基因組估計后分配給每種遺傳效應的遺傳變異的量。為了簡要說明該方法在實踐中的行為,我們還將fBayesB應用于實際數據示例。在第三部分,我們概述了通過fBayesB方法估計非加性效應的一些約束,并討論其他解決策略。