- Wilkinson GN, Eckert SR, Hancock TW, Mayo O. Nearest Neighbour (NN) analysis of field experiments. J. R. Stat. Soc. B [Internet]. 1983 [cited 2016 Dec 21];45:G1–25. Available from: http://sci-hub.cc/http://www.jstor.org/stable/2345523
概要
論文分為兩部分。第一部分介紹了蒙特卡羅隨機研究的Papadakis的NN分析的協方差方法的結果,顯示(i)非迭代的Papadakis分析傾向于保守地偏向; (ii)Bartlett(1978)建議的分析的迭代導致治療F比的顯著正偏差; (iii)當在數據中存在顯著的趨勢效應時,該方法是非常低效的。給出這些結果的理論解釋。第二部分描述了由第一作者發現并與合作者合作開發的NN分析的新方法。該方法本質上是用于“固定”塊(或行,列)的經典形式的分析的“移動塊”模擬。它避免了Papadakis的方法的缺陷,并導致大約無偏見的分析。與完全或不完全塊實驗的經典分析相比,其平均幾乎總是并且經常顯著更有效,并且如果在數據中存在可觀的行x列相互作用,則比拉丁或格子正方形設計的標準分析更有效。描述了NN平衡的新設計標準。隨機化下的新方法的有效性用蒙特卡羅研究經驗證明。
介紹
45年前由Papadakis(1937)提出并隨后由Bartlett(1938)討論的,通過協方差分析調整相鄰地塊的處理校正產量的局部趨勢效應的場試驗的產量的想法。遺憾的是,這個重要的想法遭受了長時間的忽視,直到阿特金森(1969)恢復了它的興趣,也參見耶茨(1970,第148頁)。 Pearce和Moore(1976)提請注意在實際應用Papadakis方法時可能的處理估計準確性的實質性提高,Bartlett(1978)在向皇家統計學會的一篇論文中重新審查了其理論性質參考對稱自回歸形式的最近鄰模型。 Bartlett還建議該方法的迭代,使用來自先前迭代的處理估計來重新定義電流的最近相關協變量。 Pearce(1980)和Kempton和Howes(1981)提出了關于該方法的實際價值的額外的經驗證據。
Papadakis方法的許多理論討論集中在固定模型上。我們認為這是在田野實驗的上下文中的錯誤,其中非穩態趨勢效應通常是主要考慮因素。事實上,最近鄰近調整在我們稱為場近似實驗的最近鄰(或NN)分析的主要作用可以被描述為提供連續形式的局部去趨勢,與經典方法的逐步塊解除分析。本文從這個角度重新考慮了Papadakis方法,并且還描述了一種更有效的替代方法。本文按照這兩種方法分為兩部分。第一部分首先描述了具有均勻性數據的Papadakis方法的廣泛的Monte Carlo隨機化研究的結果。結果顯示,盡管非迭代的Papadakis分析在隨機化(略微傾向于保守偏差)下是合理有效的,但是Bartlett(1978)建議的分析的迭代導致治療F比的嚴重向上偏差。然而,該方法的最嚴重的缺陷被發現是當趨勢效應可感知時其固有的低效率。在1.3節中,根據平滑趨勢+獨立誤差模型推導了無效率的理論解釋。還給出了來自迭代的偏差的簡單解釋。 Papadakis方法中的低效率的來源被發現是形成最近相鄰協變量時治療效果的產率的先前校正。這導致第一作者發現一種替代的,更有效的NN分析方法,其可以合適地稱為在Rothamsted實驗站開發的經典“固定塊”分析方法的“移動塊”類似物。新的方法將在第二部分中描述,我們將其進一步討論推遲到第11.1節。
第一部分Papadakis的方法
1.蒙特卡羅隨機研究數據集在研究中使用了三組均勻性數據,從Wiebe(1935),Mercer和Hall(1911)和Kempton和Howes(1981)。它們描述如下。 Wiebe數據包括1500個小麥產量,1500個植物行,15英尺長和1英尺間距,125行×12列場布置。我們將其分為兩個標記為W1和W2的集合,分別包括列1-6和7-12。 W1比W2更加可變,并且包括具有非常高產量的貼片。由于實驗使用8排籽粒鉆進行播種,其產生了對產量的行效應的重現模式,通過求和至8排總積分進一步減少數據。在本文的其他地方,我們還考慮4行總計,并區分具有下標8或4的兩種情況。基于8行總和的輪廓圖如圖3所示。 Mercer和Hall數據,標記為MH,是來自20×25陣列的長10.8英尺長和11行寬,具有9英寸行間距(從指定的圖面積估計,0.002英畝)的小麥產量。我們通過求和將這些數據匯總到4列總計的20×6陣列(省略列25)以獲得相對長的圖的產量,其中1-D NN調整將是適當的。來自Kempton和Howes(1981,第64頁)的第三個數據集(KH)包括來自5英尺×14英尺樣地的28×7陣列的大麥產量。實驗設計和分析研究涉及a(3×2×2×2 )因子集的24次運行和100個隨機設計,用于疊加在數據集WI,W2和MH上的5×6陣列中的30次處理的2或3次重復,以及在KH上的4次運行的附加的2×2階乘集,具有4次重復在7×7陣列中的49處理。然后在每種情況下進行10個循環重復的Papadakis分析,總共進行了28000次個體分析。研究中的其他因素有隨機:無限制,限制性;分析方法:1-D,2-D
無限制隨機化是具有指定數目的重復和治療的隨機區組設計。除此之外,隨機化被限制為給出第二級部分平衡(參見第11.6節),除了KH,其中限制性隨機化是用于平衡格子正方形設計,用于與Kempton和Howes(1981) 。使用針對列鄰居的單個NN協變量(1-D情況)或者針對行和列鄰居的兩個協變量(2-D)來執行Papadakis分析。邊界圖的協變量值僅使用可用的鄰居來定義,因為邊界圖不包括在設計中。我們最初的研究,1980年12月完成,包括在Wi,W2和MH只有6運行,限制隨機化和1-D分析。當Kempton和Howes的論文于1981年出版時,我們添加了一個關于KH的運行,以解決我們的結論與他們的結論之間的明顯差異。 Kempton(個人溝通)建議,差異可能是由于他們的研究中的受限隨機化(他們也使用2-D分析),所以我們如上所述擴展我們的研究。 (Kernpton自從他們原來的計算中發現一個錯誤,他們修改后的蒙特卡羅結果現在與我們的一致。