- Piepho H, M?hring J, Pflugfelder M, Hermann W, Williams ER. Problems in parameter estimation for power and AR (1) models of spatial correlation in designed field experiments. Commun. biometry Crop Sci. 2015;10:3–16.
AR(1)和空間相關的功率模型在現場試驗數據的分析中是流行的。當自相關參數ρ傾向于為零或一致時,可能發生這些模型的估計和解釋的數值困難。這里使用三個不同的示例來考慮這些問題。第一個例子是基于部分復制設計的模擬數據,其中真實的底層方差協方差結構是已知的。其他兩個例子涉及來自精確農業試驗和植物育種試驗的真實數據。我們建議四個選項來處理觀察到的數值問題,并說明它們與示例的使用。在示例中示出,AR(1)模型的空間坐標的重新縮放或重新參數化作為指數模型可以有助于模型收斂。我們得出結論,AR(1)模型的個別參數估計應仔細解釋,特別是當自相關估計接近零或單位時。
引言
在混合模型框架中嵌入的空間方差 - 協方差結構在現場試驗的分析中已經變得流行(Gilmour等人1997,Piepho等人2008,Gon?alves等人2010)。最常見的空間模型假設與距離的空間相關性的非線性衰減。在每個圖的單次觀察的隨機化實驗中,可以在同一塊中的圖之間假定空間相關性(Williams 1986)。類似地,在具有大圖的農場試驗中,可以獲得每個圖的許多空間參考測量(即記錄空間坐標的測量),以及相關的協變量信息。對這些試驗的全面分析需要考慮同一地塊重復測量之間的空間變化(Piepho et al。2011)。用于具有等間隔圖的場試驗的非常流行的非線性空間模型是一階自回歸AR(1)模型。該模型暗示與空間距離??的相關性的指數衰減,根據圖之間的滯后距離測量,等于間歇圖的數量加1。模型也可以擴展到兩個維度,最流行的變量是可分離的AR(1)?AR(1)模型(Gilmour等人,1997)。當對每個地塊進行重復觀測時,正如在精確農業實驗中常見的情況,觀測通常是不規則的間隔,而不是形成一個精確的矩形網格(Piepho et al。2011)。 AR(1)模型不適用于這種實驗,因為它需要相等的間距。然而,AR(1)模型可以容易地擴展到不等間隔測量,如所謂的功率模型或指數模型(Gotway和Schabenberger 2004)。這兩個模型是基本上相同模型的不同參數化(參見下文)。通常,當試圖使用提供混合模型分析的各種統計包來基于殘差最大似然(REML)將非線性空間模型擬合到現場試驗數據時遇到數值問題。例如,REML算法可能無法收斂,或者最終的Hessian矩陣可能不是非正定的。在本文中,我們考慮AR(1)和功率模型的這些問題,并看看可能的補救措施,以實現收斂到一個正確的解決方案。還考慮參數估計的解釋。使用三個不同的示例來說明在實踐中遇到的典型問題,并且討論可能的解決方案。第一個例子是基于部分復制(p-rep)設計的模擬數據(Cullis等人2006,Williams等人2011,2014),而其他兩個例子涉及精確農業試驗和植物的真實數據育種試驗。
本文組織如下。首先我們介紹三個例子。接下來,我們描述空間模型。隨后簡要介紹嘗試適合這些模型時的潛在問題,在收斂問題的情況下解決故障的可能措施以及這三個示例的應用。本文最后簡要討論和我們的建議。
討論和結論
我們調查了在隨機試驗中擬合功效和AR(1)模型時可能出現的一些數值問題。我們還考慮了一些選項,當默認設置失敗時,實現收斂到基于REML的過程的正確解決方案。關鍵問題是,空間分量可能與熔核方差或對于實驗單位例如塊(在每個圖的單次觀察的隨機化實驗的情況下)和圖的隨機效應混淆(在隨機化實驗的情況下在同一圖上進行的重復和空間參考測量)。我們表明,需要小心解釋各個參數估計。通常,它們可以產生空間相關性顯著的印象,而對于塊和獨立殘留誤差的基于隨機化的效應很小。但是本文中闡明的混雜問題意味著在模型的不同參數的估計之間存在相互作用,并且大的自相關估計可能實際上是由于塊效應的大變化,反之亦然。類似地,與大的空間方差相關聯的小自相關估計實際上可能與塊金方差混淆,并且與空間距離??的相關性的衰減可能如此之快,使得塊內的擬合的成對殘差相關對于大多數對圖。因此,僅僅查看空間方差估計可能是誤導。也許最好避免單獨對各個參數估計的強烈解釋。相反,重點應放在數據的整個擬合方差 - 協方差結構上。在隨機現場試驗中,建議使用具有簡單隨機效應的基于隨機化的模型(Nelder 1965)。這可以被視為涉及空間附加組件的更精細建模的出發點。當空間模型難以擬合或不提供改進時,這樣的模型也可以作為后退選項(Piepho和Williams 2010)。我們建議反對在設計涉及阻塞時擬合純空間模型而不影響塊的常見做法。存在一些危險,即當實際上如果塊被擬合以反映隨機化布局時,空間相關性被錯誤地報告為高。可以通過用基于隨機化的模型開始建模過程并且僅將空間協方差視為可選的附加組件來避免這樣的問題。
在本文中,我們使用了一個特定的REML包(SAS的MIXED過程)。在某種程度上,統計程序的數值問題總是軟件特有的。由于REML算法的迭代過程的實現的差異,其他軟件可以產生不同的解決方案,特別是當難以實現收斂時。在這里我們不打算比較不同的混合模型包。然而,在我們的經驗中,AR(1)和功率模型的問題與大多數包相似,盡管相同數據集的收斂行為有一些差異。這主要是由于當ρ→0或→1時的混雜問題,這是ρ是模型本身的固有性質而不是所使用的特定包裝的固有性質。我們已經考慮過處理這些問題的選項,并用三個例子來說明。可以推薦重建AR(1)模型的空間坐標或重新參數化作為指數模型,以幫助模型收斂。在給定情況下,以下哪些選項可能工作很大程度取決于數據集。 LV模型是非線性空間模型(如AR(1))的可行替代方案,在我們的經驗中,它通常具有良好的收斂行為。因此,我們建議在探索競爭空間附加組件到基于隨機化的模型時定期考慮這個模型。