如果多組間比較認為總體上有統計學差異,通常還可以進一步做組間兩兩比較。兩兩比較的方法有很多,SPSS就提供了20余中,多到令人尷尬,令人不知如何選擇。
常用的兩兩比較方法
LSD:實際上是 t 檢驗的改進,在變異和自由度的計算上利用了整個樣本信息,而不僅僅是比較兩組的信息。它的敏感度最高,在比較時仍然存在放大α水準(一類錯誤)的問題,換言之就是總的二類錯誤非常小,要是LSD法都沒有檢驗出有差別,恐怕真的沒差別了。
Bonferroni:由 LSD 法修正而來,通過調整每個檢驗的α水準來控制總的α水準,最終保證總的α水準為0.05,該方法敏感度介于 LSD 法和 Scheffe 法之間。
S-N-K:即 Student Newman Keuls 法,是應用最廣泛的一種兩兩比較方法。它采用Student-Range 分布進行所有組均值間的配對比較。該方法保證在H0真正成立時總的α水準等于實際設定值,即控制了一類錯誤。
TUKEY:即 Tukey's honestly significant difference 法(Tukey’s HSD),采用 Student-Range 統計量進行所有組間的兩兩比較。但與 S-N-K 法不同的是,它控制的所有比較組中最大的一類錯誤概率不超過α水準。
Scheffe:當各組人數不相等,或者想進行復雜比較時,用此法較為穩妥。它檢驗的是各個均數的線性組合,而不是只檢驗某一對均數間的差異,并控制總體的α水準等于0.05。正因如此,它相對比較保守,有時候方差分析F值差異有統計學意義,用該法做兩兩比較也找不出差異來。
Dunnett:主要用于多個實驗組與一個對照組的比較,實驗組之間不做比較。
如何選擇兩兩比較方法
如何在如此之多的兩兩比較方法中選出合適的方法是一個令人頭痛的問題。由于 S-N-K 法的結果閱讀非常方便。以前國內都以 S-N-K 法最常用,但根據近年來的研究發現,當兩兩比較的次數極多時,該方法的假陽性非常高,因此當比較次數較多時(例如有10組作兩兩比較,則比較次數會有45次),對用S-N-K法得到的有統計學意義的結論要謹慎一些。
根據相關研究的檢索結果,除了參照所研究領域的慣例外,一般可以參照的標準為:
- 如果存在明確的對照組,要進行驗證性研究,即計劃好的某兩個或幾個組間(和對照組)的比較,適宜用 Bonferroni(LSD)法;
- 若需要進行多個均數間的兩兩比較(探索性研究)且各組人數相等,適宜用 Tukey法;
- 其它情況適宜用Scheffe法。