定義未知親本組(UPG)工具—利于聯(lián)合育種

image.png

文章中圖4. Jersey 牛 Ketosis 估計(jì)遺傳趨勢(shì)。

背景:

未知親本組(UPG)根據(jù)產(chǎn)地(國(guó)家,品種)、年份和選擇途徑對(duì)缺失的親本關(guān)系進(jìn)行建模(注:我國(guó)動(dòng)物系譜記錄也有待加強(qiáng), 當(dāng)然對(duì)于豬聯(lián)合遺傳育種這個(gè)更需要定義)。遺傳評(píng)估需要合理的規(guī)則來(lái)定義未知親本組,以確保準(zhǔn)確估計(jì)并避免跨品種或年份比較動(dòng)物的偏差。隨著評(píng)估的復(fù)雜化,需要系統(tǒng)規(guī)則來(lái)形成未知親本組。

解決方法

提出了一種策略來(lái)衡量信息,壓縮和重新定義跨年份的未知親本組,并最終評(píng)估未知親本組估計(jì)的精度。這些工具將有助于估計(jì)更準(zhǔn)確、偏差更小的育種值。

  • 首先,可以通過(guò)譜系和記錄中的動(dòng)物列表輕松計(jì)算出偽計(jì)數(shù)基于有記錄后代記錄,方法是將標(biāo)記的動(dòng)物通過(guò)譜系從最年輕到最年長(zhǎng)傳播到祖先。
  • 然后提出了 2 條規(guī)則,一條規(guī)則向前連接未知親本組直到記錄出現(xiàn)(PS:即所有具有記錄以前的所有UPG可以為并為一個(gè)),第二條規(guī)則向后連接連續(xù)的未知親本組以實(shí)現(xiàn)最小偽計(jì)數(shù)(PS:即自己設(shè)定閾值,超過(guò)這個(gè)記錄)。
  • 最后,一個(gè)簡(jiǎn)化的模型估計(jì)了未知親本組對(duì)比的精度。

結(jié)果

  • 即使對(duì)于非常大的數(shù)據(jù)集,計(jì)算也是可行的。

  • 作者們用 2 個(gè)來(lái)自美國(guó)所有品種ABLUP 產(chǎn)量和健康性狀評(píng)估的例子來(lái)說(shuō)明。

  • 對(duì)于產(chǎn)量性狀,偽記錄的數(shù)量非常高,加入未知親本組主要發(fā)生在小型品種中。加入與否都會(huì)產(chǎn)生非常相似的估計(jì)育種值和遺傳趨勢(shì),不會(huì)產(chǎn)生任何影響。

  • 對(duì)于健康性狀,加入未知親本組適用于所有品種,小型品種的加入更多。對(duì)于某些性狀-品種組合,加入或不加入 UPG 會(huì)導(dǎo)致完全不同的遺傳趨勢(shì)和估計(jì)育種值。

  • 所有成對(duì)未知親本組的近似對(duì)比表明,加入U(xiǎn)PG策略可以實(shí)現(xiàn)更高的精度,即標(biāo)準(zhǔn)誤差更低。

細(xì)節(jié)

計(jì)算步驟

-1. 獲得每個(gè) UPG 的偽記錄數(shù)
基于三個(gè)假設(shè)((1)忽略V中的協(xié)方差結(jié)構(gòu),即譜系或基因組關(guān)系;(2)有記錄的動(dòng)物只有一條記錄;(3) Xb中的當(dāng)代群體和其他效應(yīng)不會(huì)“損害” UPG 估計(jì))后,一個(gè)近似模型:

image.png

每個(gè)UPG的偽記錄計(jì)數(shù)的簡(jiǎn)單計(jì)算方法是獲取Q的c=1'Q, 但是其可以不是設(shè)置Q*的情況下得出c,
具體的Fortran代碼(附件,下面鏈接):https://figshare.com/articles/software/APPENDIX_to_TOOLS_TO_REFINE_UNKNOWN_PARENT_GROUPS_DEFINITION/27312141?file=50019468

  • 2.a 根據(jù)偽計(jì)數(shù)按時(shí)間向后連接 UPG(計(jì)算每個(gè)UPG的偽計(jì)數(shù),設(shè)定閾值,再合并不滿(mǎn)足閾值的UPG分組)
  • 2.b 根據(jù)首次錄制的日期及時(shí)加入 UPG: 合并那些出生年份早于記錄開(kāi)始的群體

-3. UPG 解的計(jì)算精度
需要解除: ( Q *′ V ?1 Q ) ^?1, 這里首先要有Q,才能能到Q, 這其中涉及到Q+(計(jì)算過(guò)程可以在上述附件中看到Julia代碼)

    1. 衡量精度的指標(biāo):
      對(duì)于兩個(gè)不同的 UPG,例如i和j,比率(下圖)是估計(jì)誤差的漸近相關(guān)性。負(fù)值(例如 -0.9)表示兩個(gè) UPG 是混雜的,因?yàn)樗鼈兊目偤驮谟涗浿惺腔祀s的。且它表明各個(gè) UPG 可能合并


      image.png

      另一個(gè)診斷方法是兩個(gè)或多個(gè) UPG 之間的對(duì)比方差
      另一個(gè)有趣的對(duì)比是全品種評(píng)估中的品種對(duì)比。
      最后一個(gè)測(cè)量是元?jiǎng)?chuàng)始人的準(zhǔn)確性

實(shí)際使用的2 個(gè)性狀組

  • 產(chǎn)量(牛奶、脂肪和蛋白質(zhì)產(chǎn)量)
  • 健康狀況(低鈣血癥、皺胃露胃、酮癥、臨床乳腺炎、子宮炎和胎盤(pán)滯留)
    有關(guān)更詳細(xì)的描述,請(qǐng)參閱https://uscdcb.com/individual-traits/
    使用多性狀模型分別分析每個(gè)性狀組,因此 UPG 的定義在性狀組內(nèi)是相同的,但在不同性狀組之間可能不同

在 CDCB,UPG 最初是在包含數(shù)據(jù)庫(kù)中所有動(dòng)物的大型譜系中分配的。UPG 是根據(jù)動(dòng)物的品種、途徑(根據(jù)品種有 1 到 5 種不同的途徑)和出生年份(最早的年份是 1900 年)為整個(gè)譜系定義的。

展示對(duì)系譜需要進(jìn)行的一些統(tǒng)計(jì)查看

image.png

參考文獻(xiàn)

Tools to refine unknown parent groups definition. A. Legarra and? I. Aguilar.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容