2025-04-25

方差分析與回歸分析

方差分析

方差分析 主要處理? 多個總體均值的比較問題。
1)單因子方差分析的統計模型:

2)平方和分解
對兩個正態總體均值間有無差異可用 t 檢驗,對三個及以上正態總體均值間有無差異,需改用數據的平方和及其分解導出 F 分布來進行顯著性檢驗。

3)檢驗方法

4)參數估計
在檢驗結果為顯著時,可進一步求出總均值\mu、各水平效應\alpha_i 和誤差方差?\sigma^2 的估計。
(1) 點估計

(2)置信區間

在單因子試驗的數據分析中可得到如下三個結果:
》因子A是否顯著
》試驗的誤差方差\sigma^2?的估計
》諸水平均值\mu_i的點估計與區間估計
在因子A顯著時,通常只需對較優的水平均值作參數估計,在因子A不顯著場合,參數估計無需進行。

5)重復數不等情況

多重比較

1)水平均值差的置信區間

(8.2.1)式給出的置信區間與兩樣本的t區間基本一致,區別在于這里的誤差方差的估計使用了全部樣本而不僅僅是A_i,A_j兩個水平下的觀測值

2)多重比較問題

3)重復數相等場合的T法

4)重復數不等場合的S法


方差齊性檢驗

在單因子試驗中r個水平的指標可以用r個正態分布N(\mu_i,\sigma_i^2)(i=1,2,..,r)表示,在進行方差分析時,要求r個方差相等,這稱為方差齊性
方差齊性不一定自然具有。理論研究表明,當正態性假定不滿足時,對均值相等的F檢驗影響較小,即F檢驗對正態性的偏離具有一定的穩健性,而F檢驗對方差齊性的偏離較為敏感,所以r個方差的齊性檢驗就顯得十分必要。

1)哈特利檢驗

2)巴特利特檢驗

3)修正的巴特利特檢驗

一元線性回歸

回歸分析處理的是變量與變量間的關系。變量間常見的關系有兩類:一類稱為 確定性關系:這些變量間的關系是完全有確定的,可以用函數y=f(x)來表示;另一類稱為相關關系:變量間有關系,但是不能用函數來表示,但在平均意義下有一定的定量關系表達式。尋找這種定量關系表達式就是回歸分析的主要任務。
1)一元線性回歸模型

2)回歸系數的最小二乘估計

關于最小二乘估計的一些性質:

3)回歸方程的顯著性檢驗

(1)F檢驗

(2)? t檢驗

(3)相關系數檢驗

上述三個檢驗在考察一元線性回歸時是等價的,但在多元線性回歸場合,經推廣F檢驗仍可用,另兩個檢驗就無法使用了。

4)估計與預測


(1)E(y_0)的估計

(8.4.20)式給出了x=x_0時對應的因變量的均值E(y_0)的區間估計

(2)?y_0?的預測區間

一元非線性回歸

有時,回歸函數并非自變量的線性函數,若通過變換可將之化為線性函數,從而可用一元線性回歸方法對其分析,這是處理非線性回歸問題的一種常用方法。
1)確定可能的函數形式。
為對數據進行分析,首先描出數據的散點圖,判斷兩個變量之間可能的函數關系。
如何選擇曲線函數形式:首先,如果可由專業知識確定回歸函數形式,則應盡可能利用專業知識,若不能由專業知識加以確定函數形式,則可將散點圖與一些常見的函數關系的圖形進行比較,選擇幾個可能的函數形式,然后使用統計方法在這些函數形式之間進行比較,最后確定合適的曲線回歸方程。

在初步選出可能的函數關系(即方程)后,我們必須解決兩個問題:
》如何估計所選方程中的參數?
》如何評估所選不同方程的優劣?

2)參數估計
參數估計最常用的方法是“線性化”方法,即通過某種變換,將方程化為一元線性方程的形式。

3)曲線回歸方程的比較

-摘自《(概率論和數理統計教程 茆詩松 第三版)》

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容