- Ye TZ, Jayawickrama KJS. Efficiency of using spatial analysis in first-generation coastal Douglas-fir progeny tests in the US Pacific Northwest. Tree Genet. Genomes. 2008;4:677–92.
基于來自美國太平洋西北45個第一代繁殖區的275道格拉斯冷杉[Pseudotsuga menziesii(Mirb。)Franco]后代試驗的1,146個數據集,使用自回歸誤差結構對生長性狀進行了單試驗和跨試驗空間分析。繁殖區域包括寬范圍的緯度,經度和海拔。在不同的實驗設計,性狀,評估年齡和樹間距之間比較了使用空間分析在減少由于地點異質性導致的變化、估計遺傳參數和增加預測準確性方面的效率。利用空間分析有超過97%的數據集顯示顯著的模型改進,高度顯示比直徑或體積更多的改進。由于空間異質性,空間分析平均去除了14-34%的殘差方差,導致育種值預測精度提高20%。由于空間調整,變異系數顯著降低。空間分析前后的預測增益之間的秩相關性約為0.96,空間分析對前20%父母的平均預測增益幾乎沒有影響。由于空間調整,我們沒有觀察到改善的實質性地理趨勢。跨地點空間分析對基因型與環境的相互作用幾乎沒有影響,但傾向于增加殘差的試驗異質性。比較和討論了兩種不同的跨試驗空間分析方法。
長期以來人們認識到,環境梯度或斑塊(例如土壤肥力,土壤水分或地形)經常嚴重阻礙對林業田間試驗的處理效果的可靠估計。試驗通常用多個區組進行,其中實驗單元組被排列,使得小區盡可能均勻。因此,它們的效率取決于每個重復區組具有均勻生長條件的程度。森林遺傳測試通常涉及大量遺傳條目,區組大小通常較大,難以確保塊內均一性。田間試驗中的地點變異性通常是空間連續的。許多研究已經證明,在相鄰小區上進行的觀測比隨機觀測更相近(Cliff和Ord 1981; Costa e Silva等人2001; Cullis和Gleeson 1989; Dutkowski等人2002,2006; Magnussen 1990, 1994; Smith 1938; Upton和Fingleton 1985)。例如,Fu et al。 (1999)顯示道格拉斯杉木后代測試中的90%的位點顯示出大的空間變異。
區組內變異可能是由于競爭(Kempton 1982; Magnussen 1994),土壤肥力和水分的異質性(Pearce 1980),雜草或灌木,昆蟲或疾病以及造林方面。這種空間異質性削弱了我們使用標準統計推斷技術的能力,這些技術主要是針對從獨立和相同分布的隨機變量中提取的觀察集。結果,當存在大的空間異質性時,識別遺傳變異的能力和遺傳值預測的準確度可能大大降低。
空間分析已廣泛用于農業田間測試,以估計和解釋空間變異。已經提出并采用了許多方法來建模空間變化,例如最近鄰域調整nearest neighbor adjustment(Bartlett 1978; Papadakis 1937; Wilkinson et al.1983; Zimmerman和Harville 1991),最小二乘平滑least squares smoothing(Green等人1985; Smith和Casler 2004; Yang等人2004),kriging(Bresler等人1981; Lopez和Arrue 1995)和post blocking(Dutkowski等人2002; Fu等人1999)。在這些方法中,通過可分離自回歸(AR1?AR1)誤差結構的空間自相關建模已經變得具有吸引力,并且通常用于農業品種試驗分析(Braysher等人2001; Cullis和Gleeson 1991; Gilmour等人1997; Singh等人2003; Yang et al.2004)。例如,Grondona et al。 (1996)分析了35個使用這種模型的谷物產量試驗,發現在行和列方向上的自回歸模型是最常見的最佳模型。
森林遺傳測試通常建立在多個測試點,有時是幾年,被稱為多環境試驗(MET)。重要的是調查應用空間分析從METs收集的數據的效率,并探討如何通過空間分析的誤差減少的作用影響基因型與環境的相互作用(Cullis等人1998年;史密斯等人2001年史密斯和Casler 2004; Yang等人2004)。與單試驗分析不同,試驗中的局部空間趨勢和試驗之間的殘留異質性可能需要在MET中聯合建模。許多研究表明,在森林遺傳測試中,空間分析去除微環境異質性和提高處理估計的準確性是有效的(Costa e Silva et al.2001; Dutkowski et al.2002; 2006; Magnussen 1990; Zas 2006)。然而,這些研究都是基于單試驗空間分析。直到最近,對于使用空間分析的METs的有效性了解甚少。此外,林業試驗通常在丘陵地帶生長。空間變異性的模式和程度可能在不同環境之間變化很大,表明應用空間分析的有效性可能不同于在不同環境中消除空間異質性的能力。將期望評估跨越包括不同環境,實驗設計,性狀,年齡等的大量試驗的空間分析的效率。除了例如Dutkowski等人的很少例外。 (2006),大多數已發表的研究都是基于非常有限個數的田間試驗。
西北樹改良合作組織(NWTIC)的成員擁有自由授粉后代測試,覆蓋北美太平洋西北地區的各種環境,可獲得5至20歲的生長數據。這些測試的大量試驗和各種設計,性狀,年齡,大小和樹間距允許對位點空間異質性和空間分析的有效性的徹底檢查。在這項研究中,我們評估了相對于經典分析的空間分析(即AR1?AR1模型)的相對效率,基于來自在45個第一代繁殖區測試的275個道格拉斯 - 冷杉子代試驗的1,146個數據集。我們將空間模型應用于單試驗分析和組合MET分析,目的是了解(1)空間變異性模式,(2)控制位點變異的相對效率,(3)遺傳參數的變化和育種的準確性價值預測,和(4)空間異質性的地理模式。還對MET數據的兩種空間分析方法進行了比較和討論。
討論
已經報道,大塊空間異質性在大塊設計中更加明顯,并且不完全塊設計在控制位點變異方面優于完全塊設計(Cochran and Cox 1957; Fu 2003; Fu et al.1998; Williams et al。 2002)。在太平洋西北地區的合作第一代后代試驗中,大多數試驗以重復集(R / S)或集合設計(S / R)形式建立。測試家庭被分配為25/50族的R / S和100?400族的S / R。雖然存在一些缺點,例如缺乏連接的集合,R / S比S / R有更小的重復大小和更好的局部環境控制(這是他們被廣泛使用的原因)。我們的研究結果表明,空間分析可以有效地減少空間異質性的S / R和R / S,和S / R平均收到比空間分析比R / S更高的改進。然而,改進的統計工具從來沒有補償在使用差的設計進行實驗時損失的精度。正如Dutkowski et al。 (2006),使用良好的設計總是建議避免治療和錯誤效應的可能混淆。我們發現,具有斑塊結構的試驗在模型擬合中比具有全局梯度的試驗獲得了更多的改善。幾個模擬研究已經證明阻塞技術在控制梯度方面比在補丁方面更有效(Fu等人1998; Salvador等人2006)。因此,具有斑塊模式的大規模試驗通常在基礎模型中很難擬合,并且預期通過空間分析具有大的AIC和s2RES減少。在我們的研究中,在空間分析之前,s2RES的平均比例為梯度的65%和貼片的78%,并且在空間分析后,模型中保留了重復效應,兩者減少到52%。 s2RESts2REP的減少量在這兩種類型的空間結構之間相當匹配。這可能意味著自回歸模型的有效性本質上類似于補丁和漸變,雖然它被設計來建模補丁空間表面。 Dutkowski et al。 (2002)也提到自回歸模型是靈活的表面,它適合和有效的當地趨勢和全球趨勢。在10歲及以上時,空間自相關系數(ρ)隨樹間距而增加。與小樹間隔相關聯的小ρ值可能是由于樹木之間的競爭。競爭往往在鄰近單元之間產生負的空間自相關(Kempton 1982; Magnussen 1989; Reed和Burkhart 1985)。然而,我們發現,在這項研究中只有幾個負ρ值。當強的空間關聯和競爭共存時,它可能觀察到相對較小但仍然是正的ρ值。隨著時間的推移,空間自相關也增加。這種現象可能反映了良好試驗點對樹木生長的累積效應(Magnussen 1990)。通過消除空間異質性,高度顯示比直徑更多的改進。在其中在15歲時測量高度和直徑的166個試驗中,138個高度的AIC減少(> 20%)顯示出比直徑大得多。在僅七種情況下,直徑比高度具有更大的AIC減小(<15%)。這與Dutkowski等人報道的結果不同。 (2006)其中在模型改進中高度和直徑之間通常沒有很大差異。在他們的研究中,在8歲或以下測量生長性狀。大多數樹木都很小,可能沒有進入站立發展的競爭階段。相反,在太平洋西北部的大多數道格拉斯杉木后代測試中,冠狀閉合通常發生于10?15歲。預期樹木之間的強地上競爭,使空間模式更復雜,并減少自相關性(Fox et al.2001; Reed and Burkhart 1985)。正如Dutkowski et al。 (2006),自回歸模型不可能是競爭的最佳模型。高度的大模型改進可以由高度比直徑受密度和樹木競爭影響小的事實貢獻。
估計的遺傳方差分量s2增加或減少絕對或相對值,沒有一致的模式。這通常與Dutkowski等人的觀察一致。 (2006)。雖然在10歲及以上時高度的s2A幾乎沒有變化,但是對于直徑發現總體輕微的增加。在文獻中已經報道了關于s2A的變化的不同結果。一些研究表明一致的減少(例如,Joyce等人2002)或不一致的改變(例如,Costa e Silva等人2001; Dutkowski等人2002),但是大多數其他研究報告了s2A的增加(例如, Anekonda和Libby 1996; Belletal.1993; Hamannetal.2002; Kusnandar和Galwey 2000; Zas 2006)。雖然不可能清楚地分離為遺傳和環境效應,但是空間分析預期更好地估計s2A通過消除空間異質性。這是因為當使用假設獨立性的方法(例如,RCB分析; Besag和Kempton 1986)時,空間相關數據可能提供治療效果和方差分量的不準確估計。然而,一些模擬表明空間調整的數據可能高估s2A多單位圖設計(Loo-Dinkins1992; Loo-Dinkins等人1990; Magnussen 1993)。這對于空間分析的自信使用仍然是一個有趣和重要的問題。
這個大系列的道格拉斯杉木后代試驗允許我們探索地方空間異質性的可能地理模式。這并不奇怪,我們沒有找到強烈的地理模式。由于太平洋西北地區的地形,道格拉斯 - 冷杉后代試驗通常建立在有土壤環境梯度和斑塊型微網格模式的斜坡或地形上。網站變異性通常是特定的,隨著時間的推移是動態的,并且甚至在兩個附近的測試站點之間有很大差異。這意味著空間分析的效率也可能是位點特異性的。毫不奇怪,類似于單試驗分析,我們的研究表明,MET數據的空間分析具有明顯更好的模型擬合,并提供比經典非空間模型更準確的育種值預測。雖然空間模型(模型3)對基因型與環境的相互作用幾乎沒有影響(ΔrB≤0.04),但我們發現殘余方差的試驗異質性從基礎模型增加到空間模型。 Hill(1984)提到方差異質性導致從更多變化的環境中選擇更大部分的個體。因此,當方差異質性被不正確地建模時,在具有大差異的環境中存在過度評價優越個體的傾向(Costa e Silva等人,2005)。這種效應將被包括在模型中的空間分量加強。雖然MET分析中的模型3可以聯合模擬試驗中的局部空間趨勢和試驗中的殘留異質性,但是在模型擬合中存在一些計算挑戰。首先,與其中約99%的模型收斂的單試驗分析不同,空間MET分析(模型3)的收斂頻率低。我們的初步研究顯示了收斂的一些困難,特別是在擬合個別樹空間模型時,每個MET有五個或更多的試驗。已經有一些關于ASReml中使用的“平均信息”(AI)算法未能收斂的報告,特別是涉及多個隨機效應,多個性狀或“壞”起始值的分析(Meyer 2006; Smith等人2001) 。第二,通常需要大量的計算時間和計算機內存來分析包含大量試驗的MET數據。 MET分析中的模型2是模型3的近似,并且由于其高計算效率和收斂率而適合于MET數據的規則空間分析。我們的研究結果表明,兩個模型在遺傳力估計,育種價值預測的準確性,預測遺傳收益,父母和后代的排名非常相似。然而,模型2具有比模型3相對更高的估計G×E(即,逐個家庭)方差分量。在大麥數據的效率研究中,Cullis等人(1998)也報道了兩階段空間模型的G×E方差分量大于一階段空間模型的方差分量。由于模型2中使用的數據是通過每次試驗的空間殘差預先調整的,因此可以預期合并分析中殘余自由度的減少,并且可能低估合并的殘差方差。由于模型之間家族與殘差的相似比率,可能在模型2中高估了家庭對試驗的相互作用。