當(dāng)我們?cè)谑褂胻檢驗(yàn)的時(shí)候大多數(shù)時(shí)候都是小樣本為主,尤其是臨床試驗(yàn)中,用較少的樣本來推斷其所代表的總體是否有差異是我們的最終目的,
但是當(dāng)樣本量較大時(shí),專業(yè)統(tǒng)計(jì)得到的結(jié)果可能與真實(shí)情況有差別。因?yàn)閷?duì)于大樣本,輕微的差別就會(huì)導(dǎo)致t值變化很大,從而掩蓋了數(shù)據(jù)間真實(shí)的情況。
通過上圖兩獨(dú)立樣本t檢驗(yàn)的公式可以看出,決定t值大小的因素有樣本均數(shù)X,樣本數(shù)n和標(biāo)準(zhǔn)差S,大樣本量勢(shì)必影響t值的大小。
一味地去關(guān)注P是否小于0.05,而忽略了數(shù)據(jù)本身的情況是不可取的。關(guān)于正確理解P值的含義,我在此推薦程開明老師的這篇文獻(xiàn)。由于篇幅所限,在此就不過多展開。
今天我主要說的是如何通過效應(yīng)量指標(biāo)來輔助解讀P值,其他方法我會(huì)在之后的文章中盡量補(bǔ)充。
效應(yīng)量的概念:
效應(yīng)量是指由于因素引起的差別,是衡量處理效應(yīng)大小的指標(biāo)。與顯著性檢驗(yàn)不同,這些指標(biāo)不受樣本容量影響。它表示不同處理下的總體均值之間差異的大小,可以在不同研究之間進(jìn)行比較。平均值差異、方差分析解釋比例、回歸分析解釋比例需要用效應(yīng)量描述。效應(yīng)量不受樣本容量的影響。當(dāng)樣本容量大得到顯著時(shí),有必要報(bào)告效應(yīng)量大小。(來自百度百科)
Cohen’s d用于t檢驗(yàn),表明兩個(gè)均數(shù)之間的標(biāo)準(zhǔn)差異;
η2(偏η2)主要用于方差分析(ANOVA),表明與變量X的水平變化有關(guān)的變量Y的變化比率。
翻譯成白話就是:
1、效應(yīng)量不受樣本量的影響,真實(shí)反映效應(yīng)大小情況。
2、討論自變量和因變量強(qiáng)度關(guān)系時(shí),也不受樣本量影響。(比如在回歸分析中)
3、同樣在回歸分析中,通過效應(yīng)量指標(biāo)可以真實(shí)得出自變量對(duì)因變量的重要程度,尤其在建模找危險(xiǎn)因素時(shí)很有用。
4、當(dāng)效應(yīng)量較小時(shí),就算P值<0.05,也不能輕易下結(jié)論。
案例說明:
為了方便理解,我舉個(gè)例子來說明效應(yīng)量指標(biāo)的實(shí)際意義。
一項(xiàng)開展我國(guó)男嬰體重的調(diào)查,統(tǒng)計(jì)結(jié)果顯示北方5385人平均體重為3.08kg,南方4896人平均3.10kg,3.08kg和3.10kg實(shí)際相差0.02kg,結(jié)論應(yīng)該是南北方男嬰出生體重相差不大才對(duì)。但此時(shí)如果使用t檢驗(yàn),得出的結(jié)果確是t=2.93,P=0.0034,差異有統(tǒng)計(jì)學(xué)意義。
此時(shí)如果堅(jiān)持統(tǒng)計(jì)學(xué)結(jié)論,則會(huì)得到一個(gè)不真實(shí)的結(jié)論。因?yàn)樵跇颖玖枯^大的時(shí)候,P值會(huì)趨于小概率。
Cohen's d 的計(jì)算:
很遺憾SPSS無(wú)法計(jì)算這個(gè)指標(biāo),但我會(huì)介紹另一款統(tǒng)計(jì)軟件(JASP)可以輕易計(jì)算,在此之前我們先看看該指標(biāo)的計(jì)算公式。
獨(dú)立樣本t檢驗(yàn):
ES=(m1-m2)/s-pooled,m:均值,s-pooled:聯(lián)合方差
配對(duì)樣本t檢驗(yàn):
ES=(m1-m2)/s,m:均值,s:差值的標(biāo)準(zhǔn)差
Cohen’s d 的結(jié)果解讀標(biāo)準(zhǔn):
以上兩個(gè)標(biāo)準(zhǔn)都可以,任選一個(gè)就行。
由于不想篇幅過長(zhǎng)影響閱讀,本篇先了解一下效應(yīng)量指標(biāo)的使用背景,下一篇將通過具體的案例向大家展示,并且如何使用JASP這款軟件獲得Cohen's d效應(yīng)量指標(biāo)。拜拜。