直線回歸與相關(guān)

解決上一篇文章留下的小尾巴

在對(duì)“校準(zhǔn)驗(yàn)證”數(shù)據(jù)的處理評(píng)價(jià)中,其實(shí)是運(yùn)用了與檢驗(yàn)工作密切關(guān)聯(lián)的統(tǒng)計(jì)方法,就是 直線回歸。

這也是我們檢驗(yàn)人所必須掌握的統(tǒng)計(jì)計(jì)算方法之一。內(nèi)容也最枯燥。本篇會(huì)忽略大部分的計(jì)算公式,講好原理,計(jì)算呢就交給已經(jīng)做好的excel表格吧,直接填入數(shù)據(jù)即可。

以下內(nèi)容大部分來(lái)源于王治國(guó)等著的《臨床檢驗(yàn)方法確認(rèn)與性能驗(yàn)證》。

《衛(wèi)生統(tǒng)計(jì)學(xué)》可能真的一點(diǎn)用沒(méi)有。

直線回歸

醫(yī)學(xué)上,變量之間雖然有一定的關(guān)聯(lián),但這種關(guān)系不是十分確定的,這種不確定的關(guān)系稱為回歸關(guān)系。

直線回歸(linear regression)在于找到一條最能描述變量間非確定數(shù)量關(guān)系的直線,以 y=a+bx 表示。a 為截距(intercept),b 為斜率,其中 y 是指對(duì)應(yīng)于某個(gè)確定的 x ,相應(yīng)群體的 y 的平均值估計(jì)。

回歸線的確定主要依據(jù)“最小二乘原理”,使估算的 y 值與實(shí)測(cè) y 值間的誤差達(dá)到最小。

誤差與可信區(qū)間

標(biāo)準(zhǔn)估計(jì)誤差

直線回歸中,各實(shí)際值 y 與由回歸方程計(jì)算出的估計(jì)值 y^ 之間的誤差,為估計(jì)誤差(error of estimate )。其中 y^ 決定于均數(shù)及回歸系數(shù),自由度為 n-2。


標(biāo)準(zhǔn)估計(jì)誤差

回歸系數(shù)的標(biāo)準(zhǔn)誤

回歸方程中,回歸系數(shù) (b) 是由樣本求出的,它是對(duì)總體回歸系數(shù) β 的估計(jì)值,二者之間的誤差可以標(biāo)準(zhǔn)誤 Sb 表示。


回歸系數(shù)的標(biāo)準(zhǔn)誤


通過(guò) Sb 便可求出 總體回歸系數(shù) β 的可信區(qū)間,95%可信區(qū)間的計(jì)算公式為


總體回歸系數(shù)的可信區(qū)間

式中:t 值的自由度為 上述估計(jì)誤差的自由度,為 n-2 ,查 t 值表得。

截距 a 誤差和總體參數(shù) a 的可信區(qū)間

同上,誤差計(jì)算公式略復(fù)雜,可信區(qū)間求解方式相同。

以上標(biāo)準(zhǔn)誤可運(yùn)用 Excel 表格中的LINEST功能求得

計(jì)算方法具體參見(jiàn)“線性回歸”表格文件,感謝不明網(wǎng)友的熱心提供。(實(shí)際是網(wǎng)上下載的)

分享度盤:鏈接:https://pan.baidu.com/s/1KvIXlPQUj-X8k25RS7nPcQ 密碼:k9i3

回歸系數(shù)和截距的統(tǒng)計(jì)學(xué)意義檢驗(yàn)

由于抽樣誤差,從 β =0 的總體(即總體并不存在回歸關(guān)系)中得到的樣本回歸系數(shù)可能并不等于0 ,因此,求得不等于零的回歸系數(shù)后,也不能立即認(rèn)為總體回歸系數(shù)不等于零。

考慮到抽樣誤差問(wèn)題,需要做 β 是否等于零的檢驗(yàn)。

回歸系數(shù)的統(tǒng)計(jì)學(xué)意義檢驗(yàn),可用 t 檢驗(yàn),也可用方差分析。t 檢驗(yàn)較為簡(jiǎn)單。

計(jì)算 t 值? ? ? t =? b/ Sb

由自由度= n-2,通過(guò) t 值表作出判斷,若求得 t 值> 所查得 t 值,則 P<0.01,拒絕 B=0的假設(shè),回歸系數(shù)有統(tǒng)計(jì)學(xué)意義,認(rèn)為總體中相應(yīng)兩個(gè)變量間有直線回歸關(guān)系。

截距的統(tǒng)計(jì)學(xué)意義檢驗(yàn)同理。

書(shū)中還提到比如“兩個(gè)回歸系數(shù)差別的統(tǒng)計(jì)學(xué)意義檢驗(yàn)”等,在此不一一闡述(太復(fù)雜)。

相關(guān)

這個(gè)概念在平時(shí)工作中用得最多,用錯(cuò)的機(jī)會(huì)也很多。

相關(guān)系數(shù)說(shuō)明兩個(gè)變量間關(guān)系的密切程度,回歸方程說(shuō)明兩個(gè)變量間的數(shù)量關(guān)系,兩者說(shuō)明的問(wèn)題不同,但又是有聯(lián)系的。

由于相關(guān)系數(shù)的計(jì)算及統(tǒng)計(jì)意義檢驗(yàn)比較方便,所以我們?cè)谧骰貧w分析以前,一般先作相關(guān)分析。因?yàn)橹挥性谙嚓P(guān)有統(tǒng)計(jì)意義的前提下,求回歸方程及回歸線才有意義

強(qiáng)調(diào)一點(diǎn)吧,實(shí)際工作中可能會(huì)用錯(cuò)。

方法比對(duì)中,相關(guān)系數(shù)(r)用于指示所測(cè)樣本范圍是否足夠?qū)?,以盡可能降低一些誤差(?)的影響,而不是簡(jiǎn)單說(shuō)r>0.99便認(rèn)為方法之間無(wú)顯著差異。

只有取樣范圍夠?qū)挼那闆r下,才可通過(guò)線性回歸的方式進(jìn)行偏差估計(jì)。否則只能通過(guò)其他方式進(jìn)行比對(duì) 。

還有,統(tǒng)計(jì)方法只是一種工具,只是提供對(duì)誤差的估計(jì),而不是指示可接受性。這也是Westgard先生所極力倡導(dǎo)的觀點(diǎn)。

The statistics don't directly tell you whether the method is acceptable, rather they provide estimates of errors which allow you to judge the acceptability of a method.

統(tǒng)計(jì)學(xué)不直接告訴你方法能否接受,而是提供誤差的估計(jì),由你自己去判斷方法的可接受性。

Westgard.com網(wǎng)站提供了很多在線的統(tǒng)計(jì)工具,可直接使用,非常方便,自己做表什么的很麻煩的~

總覺(jué)得少寫了點(diǎn)啥,先就這樣吧!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,908評(píng)論 6 541
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,324評(píng)論 3 429
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 178,018評(píng)論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 63,675評(píng)論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 72,417評(píng)論 6 412
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 55,783評(píng)論 1 329
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,779評(píng)論 3 446
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 42,960評(píng)論 0 290
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,522評(píng)論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 41,267評(píng)論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,471評(píng)論 1 374
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,009評(píng)論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,698評(píng)論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 35,099評(píng)論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 36,386評(píng)論 1 294
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 52,204評(píng)論 3 398
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,436評(píng)論 2 378

推薦閱讀更多精彩內(nèi)容

  • Chapter 9 Linear Regression 本篇是第九章,內(nèi)容是回歸分析(主要以線性回歸為主)?;貧w分...
    G小調(diào)的Qing歌閱讀 16,873評(píng)論 0 25
  • 1. 簡(jiǎn)述相關(guān)分析和回歸分析的區(qū)別和聯(lián)系。 回歸分析和相關(guān)分析都是研究?jī)蓚€(gè)或兩個(gè)以上變量之間關(guān)系的方法。 廣義上說(shuō)...
    安也也閱讀 8,746評(píng)論 0 3
  • 第九章 雙變量回歸與相關(guān) x2yliner Sys.Date() 知識(shí)清單 直線回歸相關(guān)概念求法統(tǒng)計(jì)推斷區(qū)間估計(jì) ...
    x2yline閱讀 1,606評(píng)論 0 0
  • 十月份第二次打卡,我讀的書(shū)是假如給我三天光明。 20頁(yè)。 我最喜歡的句子是我長(zhǎng)著洗得像小鳥(niǎo)世界撲打翅膀那樣。
    王昱凱閱讀 170評(píng)論 0 0
  • 作者:張靜如 前段時(shí)間有簡(jiǎn)書(shū)里的讀者留言問(wèn)我,怎么寫作呢? 思考了很久,我還是沒(méi)有靈感,寫不出來(lái),直到第二次,他再...
    佩盈閱讀 873評(píng)論 10 15