Durban M, Currie ID, Kempton RA (2001) Adjusting for fertility and competition in variety trials. J Agric Sci 136:129–140. doi: 10.1017/S0021859601008541
描述了響應于生育趨勢和插圖間競爭的繪圖產量的聯合模型。該模型將三次平滑樣條的混合模型表示與模型生育率以及具有自回歸項的模型競爭的回歸模型相結合。估計是基于殘差最大似然的泛化。將這些方法應用于由英國劍橋的植物育種研究所進行的一系列70個甜菜試驗,并且結果總結。
介紹
育種者或管理機構對植物性能的評價通常涉及在小塊地帶具有大量品種的試驗設計。然而,這種試驗中品種產量之間的比較通常傾向于由于兩個扭曲因素的影響:生育趨勢和插槽競爭。有大量關于實驗設計的文獻,通過將試驗區域劃分為更小,更均勻的塊并以平衡的方式將塊分配給塊來減少土壤異質性的影響(Mead 1997)。特別地,α設計(Patterson等人,1978)現在廣泛用于全世界的植物育種試驗中。調整生育率的一個更新的方法是明確地模擬空間變異(Green和Silverman 1994; Gleeson 1997; Gilmour等人1997)。對一系列品種試驗的分析(Cullis和Gleeson 1989; Kempton等人1994)已經表明,空間分析通常比常規不完全塊分析在減少曲線變化方面更有效。小地塊品種的產量也可能受到相鄰地塊品種競爭的影響。競爭可以通過保護行顯著減少,或者等效地,通過僅收獲圖的內部行。然而,這通常是不切實際的;實際上,在種子有限的早期生成試驗中,地塊可以僅由單排植物組成。 David et al。 (1996)提出使用修飾的alpha設計,其中品種的隨機化受到限制,從而具有非常不同的競爭能力的品種從不出現在相鄰的圖中。
然而,這種方法需要提前知道品種的競爭能力。通過設計控制競爭的替代方案是在分析階段調整競爭效應。對于谷物作物,發現插圖間競爭與鄰近品種的植物高度差異最密切相關(Talbot等人,1995),并且這些差異在統計分析中由協變量調節。對于根作物,幾個作者觀察到與鄰近地塊的根產量相關的插圖間競爭:在甜菜(Kempton 1982),土豆(Connolly等人1993)和swedes(Bradshaw 1989)。具有自回歸項的回歸模型已經用于調整競爭的品種產量(Kempton 1982; Besag&Kempton 1986),但是這些模型忽略了塊內的生育趨勢,因為同時建模兩種類型的局部相關性的問題。本文提出了可用于根莖作物產量試驗的生育力和競爭的聯合模型。該模型將用于生育的平滑樣條(Green&Silverman 1994)的混合模型表示與用于競爭的Besag&Kempton(1986)模型組合。該模型允許我們采用似然法來估計競爭和趨勢的參數,并給出調整的品種產量估計。該模型應用于一系列用于單行地塊的糖用甜菜的植物育種試驗,并且之前已經發現其顯示插圖間競爭的證據(Kempton 1982)。在對試驗進行描述之后,依次考慮三個模型:(i)生育趨勢模型,(ii)競爭模型和(iii)聯合生育趨勢和競爭的組合模型。將組合模型與來自70個甜菜試驗的根產量擬合的結果被匯總以量化試驗中的生育趨勢和競爭效應的程度。由于模型的效率增益和對品種產量和排名的調整與標準完全塊分析進行比較。
一系列早產兒甜菜試驗
這些數據源于20世紀70年代和80年代初英國劍橋植物育種研究所的甜菜育種計劃。用于產量評估的第一條目(以下稱為變體)在單行圖中生長,12m長并且在行之間以0?5μm間隔開。每個試驗由36個品種的三個重復塊組成,每個塊由在每個塊的末端具有保護行的線性陣列的陣列組成。典型的現場計劃的示例如圖1所示。從這些試驗中的70個(來自1977年的33個,1978年的34個和1979年的3個)獲得了根產量,并且來自1979年試驗的數據將用于說明我們的分析的階段(表1)。在1979年的試驗中,測量了衛兵排的產量,但是這兩年前沒有做到。這里討論的所有試驗都使用完全塊設計;直到后來才引入使用較小的不完全塊來減少生育力中的塊內變化。 Arnold&Kempton(1979)描述了生育趨勢和行間競爭如何在這些試驗中偏差品種比較。他們還指出,拖拉機輪子造成的土壤壓實會嚴重影響排產量。對于本文討論的試驗,輪子在第1行和第2行之間通過,每組六行的行和第5行和第6行,在一個6行圖中,中心行產生平均23%的產量優勢為了減少使用單行圖的試驗中的隨之而來的偏差,將每個品種隨機分配一次到每個行對(1,6),(2,5),(3, 4),跨越三個重復。
植物育種者傳統上使用經典設計,例如隨機完全塊或不完全塊設計,以在試驗中調整對生育趨勢的多樣性影響。雖然隨機化理論表明,對品種隨機化的完整集合的品種效應的估計的期望將是不偏不倚的,但是來自具有顯著的生育趨勢的單一試驗的結果可能產生大量偏差的估計,特別是如果塊大且重復的數量小。在這系列甜菜試驗中,有36個品種,只有3個重復,因此在一些試驗中可能出現由于生育趨勢的偏差。處理塊內生育力變化的一種技術是使用平滑數學函數來建模生育力。假設數據(xi,yi) 1,...,n可用;在本上下文中,xi表示塊內的繪圖位置,yi表示產量。 Green&Silverman(1994)認為平滑是一個懲罰最小二乘問題,其中平滑函數g(x)被選擇為最小化
其中λ是確定函數g(x)的平滑度的參數。最小化問題(1)的解是三次平滑樣條,并且可以通過最小化例如廣義交叉驗證分數來選擇平滑參數λ(Green和Silverman 1994)。平滑參數λ的較大值導致更平滑的擬合曲線。一個簡單的例子說明平滑樣條的擬合和平滑參數λ的作用。令yi?(xi≤5)(xi≤15)(xi≤25)? 1000?εi,其中xi?1,...,36和εi是獨立的(0,1)變量。圖2示出了對于xi以及兩個擬合的樣條的yi的實現;更平滑的函數產生于λ≥74≤75,而λ≤10≤75給出更粗糙的函數。兩種特殊情況也值得一提:λ≥0給出了內插數據點yi的函數,而λ?給出數據的線性擬合。下面討論λ的選擇。擬合三次平滑樣條的另一種方法是使用混合模型表示法(Verbyla et al。1999)。這個數學設備使我們能夠通過最大似然選擇λ,或者更適當地通過剩余最大似然(REML)選擇λ;參見例如Genstat 5(1993)參考手冊,第10章,關于REML算法的討論。這種方法的吸引力之一是三次樣條的混合模型可以擴展到具有多種效應和塊內不同生育率的模型。該模型還可以擴展到包括競爭效應,從而給出一種統一的方法來建模品種效應,生育力和競爭。在附錄中,顯示了在REML樣式框架中如何適應各種具有平滑生育趨勢和競爭效應的多樣性效應的模型。本文的主要部分集中在描述模型和從擬合這些模型到實際作物數據的結論。
混合模型為單個三次樣條
假設已經獲得了來自均勻性試驗中的單個線性陣列的圖的產量。考慮一個解釋性向量變量(繪圖位置)x ?? (1,...,n)與相關的生育向量y ?? (y4,...,yn)。在完整的塊分析中,每個圖中的生育水平通過塊內平均yi n來估計。然而,假設yi對xi的圖表示yi中的平滑趨勢。在矩陣符號中,yi中趨勢的混合模型可以寫為
其中xs≠x≠xE,xE是等于Σxi≠n的元素的向量。響應y由三部分組成:第一,固定效應,這里是平均值μ(廣義固定塊和品種效應);第二,生育趨勢f(x)?βsxs?Nsus,它被劃分為沿塊長度的固定線性趨勢(βsxs)和隨機非線性趨勢(Nsus),其中us是一組相關隨機法線偏差為零均值和基本方差σ5s;第三,殘余變量ε,其以通常方式通過具有零均值和方差σ5的獨立的,相同分布的正態變量建模。 (關于Ns和us的定義,參見附錄方程式(8)到(11))。現在可以估計該混合模型中的參數,即固定效應μ和βs以及方差分量σ5和σ5s?;旌夏P秃腿纹交瑯訔l之間的連接是平滑參數等于方差分量的比率,即λ?σ5?σ5s(Verbyla等人1999)。來自混合模型的擬合值與由具有相同平滑參數λ值的平滑樣條給出的擬合值完全一致。在這個簡單的例子中,固定效應的估計是μ5ΔyD,趨勢f(x)的估計是Sy,其中S ?S(λ)是在附錄(12)中定義的平滑矩陣。平滑樣條被定義為平滑參數λ的函數。平滑量的替代測量是平滑矩陣S的跡(由tr(S)表示),并且許多統計包指定此平滑樣條替代方法。 λ的值等于0(數據的內插)或? (線性趨勢)分別對應于等于n≥1或至1的tr(S)。因此λ和tr(S)是擬合曲線的平滑度的反向量度?;旌夏P头椒ㄓ兄谕ㄟ^殘差最大似然(REML)估計平滑參數λ(參見附錄公式(15))。在我們的簡單例子中,λ5≈74≤75,相當于tr(S)? 4和32,以及擬合的樣條( - ),如圖4所示。 2,是對潛在生育力的估計。為了比較,還示出了λ≤10≤75或tr(S)≤7的樣條( - - - )。沒有多樣性效應的單個塊的簡單模型已經在一些細節中討論,因為這個模型可以以直接的方式被推廣到用于完整塊設計中的多樣性試驗的模型?,F在將考慮用于區塊內的建模趨勢的兩種選擇:(i)當每個塊中的趨勢由公共值λ指定時,以及(ii)當每個塊具有其自己的λ值時。
完整塊的混合模型
在t個品種的單獨完整塊中的多樣性試驗的混合模型表示是(2)的泛化,
同樣,響應y由三部分組成:第一,固定效應Xβ,其中X是各種設計矩陣,β是多樣性和塊效應的向量;第二,生育趨勢Xsβs?Nsus,包括跨塊的固定線性趨勢(Xsβs)和隨機非線性趨勢Nsus的和;第三,殘差ε。有關Xs,Ns和us的定義,請參見附錄。對于單塊模型,可以通過REML估計平滑參數λ(或者如果為每個塊擬合單獨的平滑參數,則為λ4,...,λp)。然后通過調整生育力的品種效應的估計
并且基本生育力的估計是S(y≤Xβ5)。將該模型擬合于表1中的甜菜試驗數據,以說明通過在塊內擬合平滑樣條來調整生育力的多樣性方法的估計的影響。在產量模型中考慮了拖拉機輪的附加效果,通過擬合每個塊的36個圖的行效應的系統模式1 2 3 3 2 1 1 2 3 3 2 1。這些行效應在本試驗中不顯著,并且從說明性分析中省略,但是在下面報道的所有70個試驗的分析中,這些效應常規地包括在固定效應的載體β中(也參見討論)。圖3( - )是估計的生育率趨勢S(y≤Xβ5)的圖,其中β5是從(4)計算的,λ5≈222是λ(公共的跨塊)的REML估計。顯然,在塊2中存在強的非線性生育趨勢。圖3( - - )也給出了當殘差似然性在λ2(λ4,λ5,λ6)上最大化時的估計的生育趨勢的圖, 。 (486,48,?),其中λ56?對應于塊3中的線性生育趨勢。共同和分離λ的擬合生育趨勢非常相似。形式上,近似似然比測試可用于比較H3:λ4? λ5λ6其中H4:λ4λ5λ6其中,測試統計量Λ^ 2(73?74),以及73和74分別是H3和H4下的殘余對數似然的最大值。計算出的Λ為2?60。在10%水平上不顯著。這表明對于該數據集,具有不同λi的模型是不必要的,并且可能導致標準誤差的低估。因此,對于該數據集,modelH3看起來比H4更合適。建模生育率趨勢影響品種均值和其標準誤差。 。 3,每個塊中品種8和36的位置已標記;在方塊1和2中,品種8在較高的生育力地區,而品種36在較低的生育力地區。表2顯示了在有和沒有生育趨勢調整的情況下這些品種的估計平均產量。顯然,未能消除趨勢會導致顯著的偏見。去除σ5的估計從15°2°到10°9°的趨勢也減少了殘余圖變化,導致了一個共同的λ(10°±5°,具有不同的λ),并且隨后減少了10%的標準誤差(表2)。差異的平均標準誤差也減少了約25%。因此,除了減少偏差,調整生育趨勢也提高了品種比較的精度。然而,趨勢的存在只是這些試驗中的一種偏倚來源。插板間競爭已經被證明是甜菜試驗的一個特征,在下一節中,考慮了調整鄰居競爭對甜菜產量的影響。