文章中圖4. Jersey 牛 Ketosis 估計(jì)遺傳趨勢(shì)。
背景:
未知親本組(UPG)根據(jù)產(chǎn)地(國(guó)家,品種)、年份和選擇途徑對(duì)缺失的親本關(guān)系進(jìn)行建模(注:我國(guó)動(dòng)物系譜記錄也有待加強(qiáng), 當(dāng)然對(duì)于豬聯(lián)合遺傳育種這個(gè)更需要定義)。遺傳評(píng)估需要合理的規(guī)則來(lái)定義未知親本組,以確保準(zhǔn)確估計(jì)并避免跨品種或年份比較動(dòng)物的偏差。隨著評(píng)估的復(fù)雜化,需要系統(tǒng)規(guī)則來(lái)形成未知親本組。
解決方法
提出了一種策略來(lái)衡量信息,壓縮和重新定義跨年份的未知親本組,并最終評(píng)估未知親本組估計(jì)的精度。這些工具將有助于估計(jì)更準(zhǔn)確、偏差更小的育種值。
- 首先,可以通過(guò)譜系和記錄中的動(dòng)物列表輕松計(jì)算出偽計(jì)數(shù)基于有記錄后代記錄,方法是將標(biāo)記的動(dòng)物通過(guò)譜系從最年輕到最年長(zhǎng)傳播到祖先。
- 然后提出了 2 條規(guī)則,一條規(guī)則向前連接未知親本組直到記錄出現(xiàn)(PS:即所有具有記錄以前的所有UPG可以為并為一個(gè)),第二條規(guī)則向后連接連續(xù)的未知親本組以實(shí)現(xiàn)最小偽計(jì)數(shù)(PS:即自己設(shè)定閾值,超過(guò)這個(gè)記錄)。
- 最后,一個(gè)簡(jiǎn)化的模型估計(jì)了未知親本組對(duì)比的精度。
結(jié)果
即使對(duì)于非常大的數(shù)據(jù)集,計(jì)算也是可行的。
作者們用 2 個(gè)來(lái)自美國(guó)所有品種ABLUP 產(chǎn)量和健康性狀評(píng)估的例子來(lái)說(shuō)明。
對(duì)于產(chǎn)量性狀,偽記錄的數(shù)量非常高,加入未知親本組主要發(fā)生在小型品種中。加入與否都會(huì)產(chǎn)生非常相似的估計(jì)育種值和遺傳趨勢(shì),不會(huì)產(chǎn)生任何影響。
對(duì)于健康性狀,加入未知親本組適用于所有品種,小型品種的加入更多。對(duì)于某些性狀-品種組合,加入或不加入 UPG 會(huì)導(dǎo)致完全不同的遺傳趨勢(shì)和估計(jì)育種值。
所有成對(duì)未知親本組的近似對(duì)比表明,加入U(xiǎn)PG策略可以實(shí)現(xiàn)更高的精度,即標(biāo)準(zhǔn)誤差更低。
細(xì)節(jié)
計(jì)算步驟
-1. 獲得每個(gè) UPG 的偽記錄數(shù)
基于三個(gè)假設(shè)((1)忽略V中的協(xié)方差結(jié)構(gòu),即譜系或基因組關(guān)系;(2)有記錄的動(dòng)物只有一條記錄;(3) Xb中的當(dāng)代群體和其他效應(yīng)不會(huì)“損害” UPG 估計(jì))后,一個(gè)近似模型:
每個(gè)UPG的偽記錄計(jì)數(shù)的簡(jiǎn)單計(jì)算方法是獲取Q的c=1'Q, 但是其可以不是設(shè)置Q*的情況下得出c,
具體的Fortran代碼(附件,下面鏈接):https://figshare.com/articles/software/APPENDIX_to_TOOLS_TO_REFINE_UNKNOWN_PARENT_GROUPS_DEFINITION/27312141?file=50019468
- 2.a 根據(jù)偽計(jì)數(shù)按時(shí)間向后連接 UPG(計(jì)算每個(gè)UPG的偽計(jì)數(shù),設(shè)定閾值,再合并不滿(mǎn)足閾值的UPG分組)
- 2.b 根據(jù)首次錄制的日期及時(shí)加入 UPG: 合并那些出生年份早于記錄開(kāi)始的群體
-3. UPG 解的計(jì)算精度
需要解除: ( Q *′ V ?1 Q ) ^?1, 這里首先要有Q,才能能到Q, 這其中涉及到Q+(計(jì)算過(guò)程可以在上述附件中看到Julia代碼)
-
衡量精度的指標(biāo):
對(duì)于兩個(gè)不同的 UPG,例如i和j,比率(下圖)是估計(jì)誤差的漸近相關(guān)性。負(fù)值(例如 -0.9)表示兩個(gè) UPG 是混雜的,因?yàn)樗鼈兊目偤驮谟涗浿惺腔祀s的。且它表明各個(gè) UPG 可能合并
image.png
另一個(gè)診斷方法是兩個(gè)或多個(gè) UPG 之間的對(duì)比方差
另一個(gè)有趣的對(duì)比是全品種評(píng)估中的品種對(duì)比。
最后一個(gè)測(cè)量是元?jiǎng)?chuàng)始人的準(zhǔn)確性
-
實(shí)際使用的2 個(gè)性狀組
- 產(chǎn)量(牛奶、脂肪和蛋白質(zhì)產(chǎn)量)
- 健康狀況(低鈣血癥、皺胃露胃、酮癥、臨床乳腺炎、子宮炎和胎盤(pán)滯留)
有關(guān)更詳細(xì)的描述,請(qǐng)參閱https://uscdcb.com/individual-traits/
使用多性狀模型分別分析每個(gè)性狀組,因此 UPG 的定義在性狀組內(nèi)是相同的,但在不同性狀組之間可能不同
在 CDCB,UPG 最初是在包含數(shù)據(jù)庫(kù)中所有動(dòng)物的大型譜系中分配的。UPG 是根據(jù)動(dòng)物的品種、途徑(根據(jù)品種有 1 到 5 種不同的途徑)和出生年份(最早的年份是 1900 年)為整個(gè)譜系定義的。
展示對(duì)系譜需要進(jìn)行的一些統(tǒng)計(jì)查看
參考文獻(xiàn)
Tools to refine unknown parent groups definition. A. Legarra and? I. Aguilar.