方差分析與回歸分析
方差分析
方差分析 主要處理? 多個總體均值的比較問題。
1)單因子方差分析的統計模型:
2)平方和分解
對兩個正態總體均值間有無差異可用 t 檢驗,對三個及以上正態總體均值間有無差異,需改用數據的平方和及其分解導出 F 分布來進行顯著性檢驗。
3)檢驗方法
4)參數估計
在檢驗結果為顯著時,可進一步求出總均值、各水平效應
和誤差方差?
的估計。
(1) 點估計
(2)置信區間
在單因子試驗的數據分析中可得到如下三個結果:
》因子A是否顯著
》試驗的誤差方差?的估計
》諸水平均值的點估計與區間估計
在因子A顯著時,通常只需對較優的水平均值作參數估計,在因子A不顯著場合,參數估計無需進行。
5)重復數不等情況
多重比較
1)水平均值差的置信區間
2)多重比較問題
3)重復數相等場合的T法
4)重復數不等場合的S法
方差齊性檢驗
在單因子試驗中r個水平的指標可以用r個正態分布表示,在進行方差分析時,要求r個方差相等,這稱為方差齊性。
方差齊性不一定自然具有。理論研究表明,當正態性假定不滿足時,對均值相等的F檢驗影響較小,即F檢驗對正態性的偏離具有一定的穩健性,而F檢驗對方差齊性的偏離較為敏感,所以r個方差的齊性檢驗就顯得十分必要。
1)哈特利檢驗
2)巴特利特檢驗
3)修正的巴特利特檢驗
一元線性回歸
回歸分析處理的是變量與變量間的關系。變量間常見的關系有兩類:一類稱為 確定性關系:這些變量間的關系是完全有確定的,可以用函數來表示;另一類稱為相關關系:變量間有關系,但是不能用函數來表示,但在平均意義下有一定的定量關系表達式。尋找這種定量關系表達式就是回歸分析的主要任務。
1)一元線性回歸模型
2)回歸系數的最小二乘估計
關于最小二乘估計的一些性質:
3)回歸方程的顯著性檢驗
(1)F檢驗
(2)? t檢驗
(3)相關系數檢驗
上述三個檢驗在考察一元線性回歸時是等價的,但在多元線性回歸場合,經推廣F檢驗仍可用,另兩個檢驗就無法使用了。
4)估計與預測
(1)的估計
(2)??的預測區間
一元非線性回歸
有時,回歸函數并非自變量的線性函數,若通過變換可將之化為線性函數,從而可用一元線性回歸方法對其分析,這是處理非線性回歸問題的一種常用方法。
1)確定可能的函數形式。
為對數據進行分析,首先描出數據的散點圖,判斷兩個變量之間可能的函數關系。
如何選擇曲線函數形式:首先,如果可由專業知識確定回歸函數形式,則應盡可能利用專業知識,若不能由專業知識加以確定函數形式,則可將散點圖與一些常見的函數關系的圖形進行比較,選擇幾個可能的函數形式,然后使用統計方法在這些函數形式之間進行比較,最后確定合適的曲線回歸方程。
在初步選出可能的函數關系(即方程)后,我們必須解決兩個問題:
》如何估計所選方程中的參數?
》如何評估所選不同方程的優劣?
2)參數估計
參數估計最常用的方法是“線性化”方法,即通過某種變換,將方程化為一元線性方程的形式。
3)曲線回歸方程的比較
-摘自《(概率論和數理統計教程 茆詩松 第三版)》