論樣本與因果律的脆弱性

——讀《統計陷阱》有感

道德

一拿到這本書,給我的感覺就一個字——薄,確實如此一共才70頁,分為10章,為總分式結構,前九章具體分析,最后一章總結。大體來說,書中舉了很多事例也有很多形象的插畫,所以我讀起來覺得沒有什么難以理解的地方。下面具體說說我對《統計陷阱》的理解。

整本書所說的陷阱其實就是圍繞“樣本”來講的,分為兩個方面,“樣本的來源”(也稱抽樣)與“樣本的表現”

樣本的來源

先說樣本的來源。確實,大部分統計的核心就是抽樣。一個以抽樣為基礎的報告如果要有價值,就必須使用具有代表性的樣本,這種樣本排除了各種誤差。忽視抽樣所隱含的誤差將導致一些愚蠢的舉動。人們有時會為了一個數學上可論證卻小得沒有意義的差別費盡力氣。這種行為是對這句古訓的藐視:“只有當差別有意義時才能稱之為差別。”這句古訓也應該辯證的去看待。

以下的話我覺得可以作為整本書識別“陷阱”的核心——“樣本有偏的趨勢可以自動地操縱結果,使其變得扭曲。無形的誤差與有形的誤差一樣容易破壞樣本的可信度。也就是說,即使你找不到任何破壞性的誤差來源,但只要有產生誤差的可能性,你就有必要對結果保留一定的懷疑。”這以后用到辯論中必定也是很有價值的,肯定有很多同學發現了。樣本的來源必須提供足夠多的信息才有說服力,比如說“顯著性程度”什么的,對比的對象,樣本的數量與區別,等等。

樣本的表現

再說樣本的表現,就是各種視覺上有誤導的圖像表現,不能說是錯誤的,只能說是不恰當的表現形式。并不是所有的統計都是絕對的,將“正常的”與“期望的”混為一談導致事情變得更糟。這也是一點需要注意的。

“如果你想證明某事,卻發現沒有能力辦到,那么試著解釋其他事情并假裝它們是一回事。在統計資料與人類思維沖撞所引起的耀眼光芒中,幾乎沒有人會發現它們的區別。不相匹配的數據是保證你處在有利位置上的武器,而且通常如此。”這也是表現誤區的一種。

相關關系與因果關系

最后,也是最重要的,談談我對這本書影響最深刻的部分,也是我認為最有價值的地方——“相關關系與因果關系”。先復制書上幾句話來湊湊字數——“但這是一個古老的謬誤,然而它仍頻繁地出現在統計資料中,并被大量讓人印象深刻的數據所偽裝。這個謬誤是:如果 B 緊跟著 A 出現,那么 A 一定導致 B。然而,更大的可能性是兩個周素并不互為因果,而同為第三個因素的產物。”之所以說它好,是因為它使我聯想到了休謨的懷疑論——一個打破了因果關系的思想,曾一度導致建立于因果律之上的科學世界瀕臨破產。畢竟他揭穿了科學知識的因果關系不過是我們習慣性的聯想,等于說是抽掉了構成知識最重要的因果律,科學知識不再具有先天普遍性的必然性。

太陽出來了,地上的石頭發熱了。很多人理所應當(注意,是理所應當)地認為,石頭發熱是陽光照射所導致的。因為太陽出來了,所以石頭發熱。很明顯的因果關系。雖然我們能觀察到一件事物隨著另一件事物而來,我們并不能觀察到任何兩件事物之間的關聯。

所以休謨說:“我們無從得知因果之間的關系,只能得知某些事物總是會連結在一起,而這些事物在過去的經驗里又是從不曾分開過的。我們并不能看透連結這些事物背后的理性為何,我們只能觀察到這些事物的本身,并且發現這些事物總是透過一種經常的連結而被我們在想像中歸類。”也因此我們不能說一件事物造就了另一件事物,我們所知道的只是一件事物跟另一件事物可能有所關連。

太陽

這里,我再舉一個例子來解釋一下這段話(例子來自于知乎),碳酸鈉+鹽酸 = 氯化鈉+二氧化碳這一因果關系,最初必然來自于經驗。假設一個人完全沒有關于實驗結果的經驗,并且沒有任何相關的化學知識,他必然沒有辦法從 碳酸鈉+鹽酸 這一原因依據任何先驗法則推論出 氯化鈉+二氧化碳 這一結果。原因中并不天然地包含著結果,在沒有經驗的情況下,從一個事物中產生任何事物都是可想象的,并沒有辦法說一定會產生出某一特定事物(無法從作為原因的事物中運用理性推論出作為結果的事物)。我們只有依賴經驗才能發見這種事物間的聯系。

因此,因果關系的基礎是經驗。

我們總是經驗到 碳酸鈉+鹽酸 = 氯化鈉+二氧化碳 這一事實(它們總是相伴出現),碳酸鈉+鹽酸在前,而氯化鈉+二氧化碳在后,于是我們就把 碳酸鈉+鹽酸 看作產生 氯化鈉+二氧化碳 的原因。更一般的情況是,甲和乙總是先后出現,甲的后面總是伴隨著乙,我們便把甲當作乙的原因。除此之外,我們無法知道甲和乙具有的更深層次的聯系(如果我們真的知道些什么,那么在經驗之先我們就能判斷將會發生什么)。到目前為止則可以說明,我們只是用因果關系來描述相伴出現的經驗事實。

因果關系基于經驗,但只是一時一地的經驗(只對發生過的事實有權發言),而要想對未來做出預測,就要基于歸納原理。即,過去甲和乙總是先后出現,甲的后面總是伴隨著乙,所以我們判斷未來甲的后面一定有乙(過去總是碳酸鈉+鹽酸 = 氯化鈉+二氧化碳,未來也一定是這樣)。

但可惜的是,歸納原理我們無法證成它,即無法說明未來必定與過去相似(可能性之一是,也許有一天,自然的法則會改變,沒有任何理由可以說明宇宙以后一定也是這個樣子)。我們沒有絕對的理由證明歸納原理一定是正確的。

因為歸納原理可能是錯誤的,導致因果關系無法向未來、類似的事物推廣,碳酸鈉+鹽酸 = 氯化鈉+二氧化碳 并不一定總是正確的。過去是1000億次是這樣,但未來1000億+1次未必還是這樣(試想,應該如何論證,未來1000億+1次結果仍相同)。另外,我們沒有掌握任何實質性的規律,我們只是對事實進行了描述,把一方設定成原因,一方設定成結果。我們不能說它是錯的,但是它一定不是肯定正確的。

人類有依賴因果關系的本能,這種本能則是來自我們神經系統中所養成的習慣,長期下來我們便無法移除這種習慣,但我們并沒有任何論點、也不能以演繹或歸納來證明這種習慣是正確的,就好像我們對于世界以外的地方一無所知一樣。就像羅素在《西方哲學史》序言所說——“人為萬物立法”,中國古代大儒所言——“為天地立心”,恐怕也是如此吧!

一句句“因為”“所以”說的理所當然,究其根本是沒有關心其聯結,如果硬是要說感官經驗使然,習慣期待為之,這套懷疑論是無法辯倒的。因此,懷疑者頂好是守住自己的范圍,并且發揮出由較深奧的研究而發生的那些哲學的反駁。在這里,他似乎有充分取勝的地方,他可以合理地主張說,在存在于記憶證據或感官證據以外的任何事實方面,我們的全部證明都是由因果關系來的;他可以合理地主張說,我們對于這種關系并沒有別的觀念,我們只是對恒常在一塊會合著的兩個物象有一種觀念;他可以合理地主張說,我們并沒有什么充分的論證可以使我們相信,我們經驗到常在一塊會合著的那些物象,在別的例證下,也照樣會合在一塊;他還可以合理地主張說,除了習慣或我們天性中一種本能以外,并沒有別的情節可以使我們得到這種推測,這種本能自然是難以反抗的,不過它也和別的一些本能一樣,也可以是錯誤的、騙人的。一個懷疑家如果堅持這些論點,那他就充分表現出他的力量來,或者可以說,表現出他自己以及我們全人類的弱點來,而且他就似乎(至少在當下)消滅了一切信念和確信。

最后康德用先天范疇很巧妙的繞過了這個問題,這里就不再說了。但是很多思考方式還是值得我們深思的??

星空
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • ①化學,是初中的一門重要科目,而化學元素也是一個你背的內容!小哥我特意弄了一份記憶口訣,供大家參考! 1氫(qī...
    銘豪閱讀 1,397評論 2 12
  • 第一章 “媽媽,我們家今天有客人嗎?”小小的手牽著母親的手,搖搖晃晃,激動又興奮,笑臉泛紅。 “有啊,馬上就可以看...
    遇鬼閱讀 649評論 8 6
  • 為之于未有,治之于未亂。 一直想有一個專屬的可以寫文章的地方,作為一個初級程序員,記錄一下工作中解決的難題,寫一些...
    七戈閱讀 2,447評論 0 3
  • 1.如何知道一個控件的坐標值? 用sdk自帶的一個工具:uiautomatorviewer.bat , 本地路徑 ...
    兼葭dx閱讀 254評論 0 0
  • 《最佳前男友》傅方思說:人會長大有三次。第一次是,發現自己不是世界中心的時候。第二次是,發現即使再怎么努力,終究還...
    李曉糖的幸福人生閱讀 506評論 0 1