3 貝葉斯定理
也叫貝葉斯規則,是由18世紀出生于英格蘭坦布里奇韋爾斯的一名牧師托馬斯·貝葉斯率先發現、后續不斷演化而來的一套推導公式,如今已被廣泛運用。
一開始上述公式僅用于兩種條件概率之間的轉換。后來引申到作為對人類信念進行理性校正的評判標準:
如果通過簡單的數學變形,還可以得出另一公式(給定新數據D后非焦點假設~H成立的后驗概率):
再推導一下會更精彩,得出“后驗概率”、“先驗概率”、“似然比”三個概念:
4 貝葉斯定理的運用實例
著名的藍、綠出租車肇事逃逸案例是個典型,在《思考,快與慢》等其他書中也被引用并加以詳解,用以說明基礎比率的關鍵性:
以下是經由貝葉斯定理的精準計算結果:
但經過專業訓練者其實也可以不通過計算就得出比較準的“主觀概率”(因為有時候僅僅是需要認定綠車的嫌疑更大,而非求得0.41這個具體數字),心算推理過程如下:
不過丹尼爾·卡尼曼的研究更為深入、對我們習得邏輯思維也更有指導意義。他先是用2種基礎比率概念替換成更容易引起人們警覺的表述:
接著其實是從人腦總是選擇性地依靠一快一慢兩個系統當中之一來應對思考這個高度講述了個中理由:
他說道:
在出租車問題的情境中,忽略基礎比率信息是一個認知錯誤,是貝葉斯定理的失??;依賴因果關系基礎比率才能獲得令人滿意的答案,形成對綠車司機的思維定式便會提高判斷的準確度。然而,在其他敏感復雜的社會情境中,我們不想根據某個團體的相關統計數據對個人做出可能是錯誤的結論。事實是我們認為應該將基礎比率視為與整體相關的統計學事實,而不是與個人相關的假設性事實。換言之,我們反對利用因果關系基礎比率。
讓我們再看類似的一個案例:
這次變成一個“關乎人民群眾生命健康”的問題了,而研究對象是“專業的醫生”,人們能否正確進行推理呢?
基礎比率千分之一,說明1000人中會有1人得病,999人不得病,是不是很低呀?
假陽性率是5%,等于放大到1000人的話是50人會被誤診。
是不是很顯然抽中被檢測為陽性的這個人患病率已經拉得很低呢?
千萬小心喲!我們女性乳謝癌也會存在這種高概率誤診咯。
請讀者耐心閱讀上圖兩種表述,結合前文兩例猜測下再看答案:
8/107,約等于7.5%。8+99=107個人陽性,真正得癌的只有前面那8個人。
坦言之,概率思維缺乏的我,面對上圖:左邊那種表述,大腦估算很是混亂,右邊這種版本,則略微有點感覺。這也吻合前文有關因果關系基礎比率反而不為人所用的研究結論。
我們可以把右邊看成左邊的“土話版”,不是說文字表述嚴謹性、邏輯性降低了,而是人腦慣常思維更適應右邊的語言,看到右邊這段文字就會激發敏感與警覺,注意未得乳腺癌的人概率更高這個基礎比率,而換成左邊的純統計學數字(盡管還是基礎比率)就會當成無關信息略過或者分析判斷時容易被忽略。而這,是邏輯校正需要突破的口。
讓我們切換下角度,再來看書中2個也是關于疾病和治療方案的例子:
假想自己是醫生,要當機立斷一名紅疹病人罹患另一怪病的可能性,你是否能一眼關注到必須首先確認的是“有紅疹但沒得怪病之人的比率”?
還是作為醫生,你是如何知道一項治療方案很可能并非許多人誤以為那么有效的呢?
從圖上方2*2矩陣表里,我們往往抓住第一行——接受過該治療方案并收效的人數高于無效人數;孰不知第二行的結果令你大跌眼鏡——不用治療好得快的人數更高。(200/275<50/65)
諷刺的是,臨床醫療中這種錯覺更甚。是不是萬一被醫生判刑要再來回顧下本文然后無視診斷、繼續好吃好喝呢?
下一篇我們要總結幾個貝葉斯思維要點來。