4.t檢驗分析兩樣本均值
除了按照上面的方法,根據兩樣本的方差求出兩樣本的期望之差外,我們還可以引入假設檢驗對它們的差進行檢驗。先前在假設性檢驗的時候就已經講了H0原假設和H1備擇假設,也求出了一個假設的拒絕域。同樣的,我們也可以根據假設性檢驗的相關檢驗來檢驗兩樣本期望,而這里,我們假設H0為E(Xa)=E(Xb),H1取H0反面,而標準則是以p為0.05為準,如果p小于0.05,我們接受原假設,大于則拒絕。在先前的章節中,我們又介紹了t的相關公式,比如H0為E(X)=0,那么,我們T的計算公式則為:
在R語言里,我們常用qt()函數計算t分布的分位數,比如,qt(0.975,n-1)計算的就是t分布當中自由度為n,分位為97.5%的分位數,也可表示成事件{|T|>qt(0.975,n-1)},而P({|T|>t})就是表示R里通常看到的p值。同樣的,假設H0:E(Xa)-E(Xb)=0,那么,根據上面T值公式可得:
又回到剛剛的耗油量之差的例子,先前我們已經把里面的樣本均值和方差算出來了,因此,我們得到它們的t值是:
因此,我們算出來的p值為P(|T|>2.425531)=2×[1-P(|T|<=2.425531)],根據這個結果,我們在R模擬一下:
2*(1-pt(2.4255,191.561))
兩樣本方差比較
之前,我們已經介紹了如何用期望、置信區間和t檢驗進行兩樣本的比較;接下來,我們還要介紹一種方法來比較兩個樣本,它就是方差比較。
首先,我們在講第11章就講了講卡方分布。卡方分布就是假設一個標準正態分布有X1,X2……Xn這n個隨機變量,而它們的隨機平方和由組成一個新的分布的就稱之為卡方分布;而卡方檢驗就是在假設性統計里,統計推斷值和實際值的偏差,以卡方值表示。卡方值越大,即它們的偏差就越大,反之亦然,如果為0,即它們沒有任何偏差。
而這里,我們要介紹的是F檢驗法。我們還是假設兩個樣本的方差分別為Sa和Sb。構造F分布的時候,我們可以根據它們兩個樣本的方差構造得:
其中,左邊就是分別構造兩樣本的方差估計值和實際值的比率,之所以要構造這個比例,就是因為F分布的計算標準就是根據比率進行的,因此我們也就得到了上面的那個公司。
在R里面,qf()函數計算F分布的分位數,一般形式為qf(σ,dfa,dfb),其中,σ表示求哪個分位的分位數,dfa和dfb分布代表樣本a和樣本b的自由度。
現在,根據F分布的公式,再結合qf()函數來構造它的95%置信區間,得:
根據這個公式,我們可以得到:
現在,我們假設H0:Var(Xa)/Var(Xb)=1,而原假設的拒絕域為Fqf(0.975,qfa,qfb),而p則為2P(F>f)=2[1-P(F<=f)],它在f<1條件下成立。衡量的標準還是p值是否達到0.05。現在,再次回到之前的耗油量之差的例子,用R模擬過程和結構如下:
var.test(dif.mpg~heavy)
我們看到p值僅為0.16663,小于0.05,這時,我們要拒絕原假設,即,Var(Xa)和Var(Xb)不相同。同時,從這份報告中,我們還看到比率的95%置信區間為[0.4189200,0.9162126],而樣本的比率方差,在最后一行可以看到,是0.6196502;而這一個值,就是由先前我們在求耗油量之差時求出來的,Sa2/Sb2得來的,具體Sa和Sb可以根據先前的結果查看。這里,再說一下p,根據耗油量之差,我們可以用相關函數pf()模擬計算,過程如下:
2*pf(0.6196502,102,101)
最后,我們算一算兩樣本方差比率的95%置信區間,過程結果如下:
qf(0.025,102,101)
qf(0.975,102,101)
得到95%置信區間為[0.676317,1.479161]。
總結
這一部分的內容把樣本的比較方法單獨拿出來講,說明比較兩個樣本的內容還是相當重要的,而且有很多的方法和相關理論需要掌握。
這部分內容,我們分別從均值、置信區間和方差這3個角度來比較這兩個樣本的大致情況。比較這兩個樣本的重要指標就是引入了t檢驗和F檢驗,也就是說,我們分別從t分布和F分布來間接比較這兩個樣本。
用均值進行兩樣本的比較,我們列舉了汽車耗油量之差這個例子,把里面的數據分成2組,然后用t分布計算出相關的p值,并與p值的極值0.05進行比較,如果大于0.05,我們接受原假設,反之亦然。另外,我們在介紹比較兩樣本的方差之前,我們還通過構造t分布來比較兩樣本的均值,計算相關的t值和p值,并對比我們所求出的拒絕域;如果落入拒絕域,則原假設不成立,反之亦然。
用置信區間比較兩樣本,我們引入了兩個樣本的期望,同時也引入這兩個樣本的標準差,通過置信區間的計算公式,利用兩樣本的均值之差構造出95%置信區間,然后根據這個置信區間進行分析。
最后,我們還引入了F分布,通過構造兩樣本的方差之比進行F檢驗分析,同樣比較它的p值是否達到0.05;如果達到,我們接受原假設,反之亦然。
從上面的文章,我們可以看到假設性檢驗的其中一種應用,它通過計算相關的值和我們原來的假設進行比較,作為我們的假設是否合理的一個重要指標。由于受限于水平以及課本所提到的內容,可能很多地方會有一些錯誤,也歡迎大家留言指出。當然,如果大家有什么疑問也可以到留言板上留言,我會盡自己的能力幫你解答。最后,由于文章講的比較少,而且可能比較難以理解,同時也是讀書筆記的形式來寫的,所以我打算在后面一段時間,會從概率論與數理統計的角度,把這個系列的讀書筆記里所提到的知識進行一個擴充,這樣能更有助于你們理解統計學的相關內容。后面的章節,我們就要開始簡單的講述相關的統計模型;不過,由于已經快到本書的結尾,而本系列的比較也很快就寫完了,所以如果大家還想看更多的統計模型,我后續也會以各種方式進行補充。
轉載于:http://shujuren.org/article/98.html