解決上一篇文章留下的小尾巴
在對(duì)“校準(zhǔn)驗(yàn)證”數(shù)據(jù)的處理評(píng)價(jià)中,其實(shí)是運(yùn)用了與檢驗(yàn)工作密切關(guān)聯(lián)的統(tǒng)計(jì)方法,就是 直線回歸。
這也是我們檢驗(yàn)人所必須掌握的統(tǒng)計(jì)計(jì)算方法之一。內(nèi)容也最枯燥。本篇會(huì)忽略大部分的計(jì)算公式,講好原理,計(jì)算呢就交給已經(jīng)做好的excel表格吧,直接填入數(shù)據(jù)即可。
以下內(nèi)容大部分來(lái)源于王治國(guó)等著的《臨床檢驗(yàn)方法確認(rèn)與性能驗(yàn)證》。
《衛(wèi)生統(tǒng)計(jì)學(xué)》可能真的一點(diǎn)用沒(méi)有。
直線回歸
醫(yī)學(xué)上,變量之間雖然有一定的關(guān)聯(lián),但這種關(guān)系不是十分確定的,這種不確定的關(guān)系稱為回歸關(guān)系。
直線回歸(linear regression)在于找到一條最能描述變量間非確定數(shù)量關(guān)系的直線,以 y=a+bx 表示。a 為截距(intercept),b 為斜率,其中 y 是指對(duì)應(yīng)于某個(gè)確定的 x ,相應(yīng)群體的 y 的平均值估計(jì)。
回歸線的確定主要依據(jù)“最小二乘原理”,使估算的 y 值與實(shí)測(cè) y 值間的誤差達(dá)到最小。
誤差與可信區(qū)間
標(biāo)準(zhǔn)估計(jì)誤差
直線回歸中,各實(shí)際值 y 與由回歸方程計(jì)算出的估計(jì)值 y^ 之間的誤差,為估計(jì)誤差(error of estimate )。其中 y^ 決定于均數(shù)及回歸系數(shù),自由度為 n-2。
回歸系數(shù)的標(biāo)準(zhǔn)誤
回歸方程中,回歸系數(shù) (b) 是由樣本求出的,它是對(duì)總體回歸系數(shù) β 的估計(jì)值,二者之間的誤差可以標(biāo)準(zhǔn)誤 Sb 表示。
通過(guò) Sb 便可求出 總體回歸系數(shù) β 的可信區(qū)間,95%可信區(qū)間的計(jì)算公式為
式中:t 值的自由度為 上述估計(jì)誤差的自由度,為 n-2 ,查 t 值表得。
截距 a 誤差和總體參數(shù) a 的可信區(qū)間
同上,誤差計(jì)算公式略復(fù)雜,可信區(qū)間求解方式相同。
以上標(biāo)準(zhǔn)誤可運(yùn)用 Excel 表格中的LINEST功能求得
計(jì)算方法具體參見(jiàn)“線性回歸”表格文件,感謝不明網(wǎng)友的熱心提供。(實(shí)際是網(wǎng)上下載的)
分享度盤:鏈接:https://pan.baidu.com/s/1KvIXlPQUj-X8k25RS7nPcQ 密碼:k9i3
回歸系數(shù)和截距的統(tǒng)計(jì)學(xué)意義檢驗(yàn)
由于抽樣誤差,從 β =0 的總體(即總體并不存在回歸關(guān)系)中得到的樣本回歸系數(shù)可能并不等于0 ,因此,求得不等于零的回歸系數(shù)后,也不能立即認(rèn)為總體回歸系數(shù)不等于零。
考慮到抽樣誤差問(wèn)題,需要做 β 是否等于零的檢驗(yàn)。
回歸系數(shù)的統(tǒng)計(jì)學(xué)意義檢驗(yàn),可用 t 檢驗(yàn),也可用方差分析。t 檢驗(yàn)較為簡(jiǎn)單。
計(jì)算 t 值? ? ? t =? b/ Sb
由自由度= n-2,通過(guò) t 值表作出判斷,若求得 t 值> 所查得 t 值,則 P<0.01,拒絕 B=0的假設(shè),回歸系數(shù)有統(tǒng)計(jì)學(xué)意義,認(rèn)為總體中相應(yīng)兩個(gè)變量間有直線回歸關(guān)系。
截距的統(tǒng)計(jì)學(xué)意義檢驗(yàn)同理。
書(shū)中還提到比如“兩個(gè)回歸系數(shù)差別的統(tǒng)計(jì)學(xué)意義檢驗(yàn)”等,在此不一一闡述(太復(fù)雜)。
相關(guān)
這個(gè)概念在平時(shí)工作中用得最多,用錯(cuò)的機(jī)會(huì)也很多。
相關(guān)系數(shù)說(shuō)明兩個(gè)變量間關(guān)系的密切程度,回歸方程說(shuō)明兩個(gè)變量間的數(shù)量關(guān)系,兩者說(shuō)明的問(wèn)題不同,但又是有聯(lián)系的。
由于相關(guān)系數(shù)的計(jì)算及統(tǒng)計(jì)意義檢驗(yàn)比較方便,所以我們?cè)谧骰貧w分析以前,一般先作相關(guān)分析。因?yàn)橹挥性谙嚓P(guān)有統(tǒng)計(jì)意義的前提下,求回歸方程及回歸線才有意義
強(qiáng)調(diào)一點(diǎn)吧,實(shí)際工作中可能會(huì)用錯(cuò)。
方法比對(duì)中,相關(guān)系數(shù)(r)用于指示所測(cè)樣本范圍是否足夠?qū)?,以盡可能降低一些誤差(?)的影響,而不是簡(jiǎn)單說(shuō)r>0.99便認(rèn)為方法之間無(wú)顯著差異。
只有取樣范圍夠?qū)挼那闆r下,才可通過(guò)線性回歸的方式進(jìn)行偏差估計(jì)。否則只能通過(guò)其他方式進(jìn)行比對(duì) 。
還有,統(tǒng)計(jì)方法只是一種工具,只是提供對(duì)誤差的估計(jì),而不是指示可接受性。這也是Westgard先生所極力倡導(dǎo)的觀點(diǎn)。
The statistics don't directly tell you whether the method is acceptable, rather they provide estimates of errors which allow you to judge the acceptability of a method.
統(tǒng)計(jì)學(xué)不直接告訴你方法能否接受,而是提供誤差的估計(jì),由你自己去判斷方法的可接受性。
Westgard.com網(wǎng)站提供了很多在線的統(tǒng)計(jì)工具,可直接使用,非常方便,自己做表什么的很麻煩的~
總覺(jué)得少寫了點(diǎn)啥,先就這樣吧!