二、因果和實驗
譯者:飛龍
協(xié)議:CC BY-NC-SA 4.0
自豪地采用谷歌翻譯
“這些問題已經(jīng),而且可能永遠留在自然界難以捉摸的秘密之中,它們屬于人類智力根本難以接近的一類問題。 - 1849 年 9 月,倫敦時報,霍亂如何傳染和傳播
死刑有威懾作用嗎?巧克力對你有好處嗎?什么導致乳腺癌?
所有這些問題試圖為結(jié)果找到一個原因。仔細檢查數(shù)據(jù)可以幫助揭示這些問題。在本節(jié)中,你將學習建立因果關系所涉及的一些基本概念。
觀察是良好科學的關鍵。觀察研究是一項研究,科學家根據(jù)他們所觀察到的,但卻無法產(chǎn)生的數(shù)據(jù)作出結(jié)論。在數(shù)據(jù)科學中,許多這樣的研究涉及對一組個體的觀察,稱為實驗的利害關系(factor of interest),以及對每個個體的測量結(jié)果。
將個體視為人是最容易的。在研究巧克力是否對健康有好處時,個體確實是人,實驗是吃巧克力,結(jié)果可能是血壓的測量。但觀察研究中的個體不一定是人。在研究死刑是否具有威懾作用時,個體可以為聯(lián)盟的 50 個州。允許死刑的州的法律是實驗,結(jié)果可能是州的謀殺率。
根本問題是實驗是否對結(jié)果有影響。實驗和結(jié)果之間的任何關系被稱為關聯(lián)。如果實驗導致結(jié)果發(fā)生,那么這個關聯(lián)是因果關系。因果關系是本節(jié)開頭提出的所有三個問題的核心。例如,問題之一是巧克力是否直接導致健康狀況的改善,而不是巧克力與健康之間是否存在關聯(lián)。
因果關系的建立往往分兩個階段進行。首先,觀察一個關聯(lián)。接下來,更仔細的分析決定了因果關系。
John Snow 和 Broad 街水泵
觀察和可視化:John Snow 和 Broad 街水泵
精確觀察導致建立因果關系的例子之一,最早可以追溯到 150 多年前。為了將你的思維帶回正確的時間,試著想象一下 19 世紀 50 年代的倫敦。這是世界上最富裕的城市,但其中許多人卻極度貧困。那時,查爾斯·狄更斯(Charles Dickens)在名氣鼎盛時,正在寫作關于他們的困境的文章。這個城市的貧困地區(qū)疾病盛行,霍亂是最可怕的。那個時候還不知道細菌會導致疾病,主流理論是“瘴氣”是主要的罪魁禍首。 瘴氣表現(xiàn)為惡臭,被認為是由腐爛物質(zhì)引起的無形的有毒顆粒。倫敦的部分地區(qū)氣味非常糟糕,特別是在炎熱的天氣里。為了保護自己免受感染,那些有能力的人把甜的東西放在鼻子上。
幾年來,一個名叫約翰·斯諾(John Snow)的醫(yī)生一直在跟蹤著時不時襲擊英國的巨大霍亂。疾病突然到來,幾乎立即致命:人們在一兩天內(nèi)死亡,數(shù)百人在一個星期內(nèi)死亡,單批總死亡人數(shù)可能達到數(shù)萬人。斯諾對瘴氣理論持懷疑態(tài)度。他注意到,當整個家庭被霍亂摧毀時,鄰居有時完全沒有受到影響。當他們呼吸和鄰居一樣的空氣和瘴氣時,不好的氣味和霍亂的發(fā)生之間沒有什么緊密的聯(lián)系。
斯諾還注意到,這種疾病的發(fā)作幾乎總是牽涉嘔吐和腹瀉。因此,他認為這種感染是由人們吃或喝的東西來進行的,而不是他們所呼吸的空氣。他主要懷疑被污染的水。
1854 年 8 月底,霍亂在過度擁擠的倫敦蘇豪區(qū)爆發(fā)。隨著死亡人數(shù)的增加,斯諾用一種在疾病傳播研究中成為標準的方法,勤奮地將它們記錄下來:他畫了一張地圖。在該地區(qū)的街道地圖上,他記錄了每次死亡的地點。
這是斯諾的原始地圖。每個黑色條形代表一次死亡。黑色圓圈標記了水泵的位置。地圖上顯示了一個驚人的啟示 - 死亡大致集中在 Broad 街水泵周圍。
https://gitee.com/wizardforcel/data8-textbook-zh/raw/master/img/2-1.jpg
斯諾仔細研究了他的地圖,并調(diào)查了明顯的異常。他們都設計 Broad 街水泵。例如:
- 死亡發(fā)生在離 Rupert 街水泵更近的房子,而不是 Broad 街。盡管 Rupert 街水泵直線上更近,但由于街道布局不方便,是死路一條。那些房子里的居民使用了 Broad 街水泵。
- 泵東邊的兩個街區(qū)沒有死亡。那是 Lion Brewery 的位置,那里的工人喝了他們釀造的東西。如果他們想喝水,啤酒廠有自己的井。
- Broad 街水泵幾個街區(qū)之外的房子里,發(fā)生了少量死亡。那些孩子在上學路上從 Broad 街水泵飲水。泵的水清涼爽口。
最后一個支持斯諾的理論的證據(jù)是,在距離 Soho 區(qū)很遠的 Hampstead 地區(qū)的兩個孤立的死亡事件。斯諾對這些人感到困惑,直到他得知死者是住在 Broad 街的 Susannah Eley 夫人和她的侄女。Eley 夫人每天都將 Broad 街水泵的水帶到 Hampstead 給她。她喜歡水的味道。
后來發(fā)現(xiàn)了一個糞坑,距離 Broad 街水泵幾英尺遠,滲入了井里面。因此,來自霍亂受害者房子的污水污染了水泵的水。
斯諾用他的地圖來說服當?shù)卣鸪?Broad 街水泵的手柄。雖然霍亂疫情已經(jīng)在減少,但是停止使用這種水泵有可能阻止了許多人死于未來的疾病。
Broad 街水泵的手柄的拆除已成為一個傳奇。在亞特蘭大的疾病控制中心(CDC),當科學家尋找流行病問題的簡單答案時,他們有時會互相問:“這個水泵的手柄在哪里?”
斯諾的地圖是數(shù)據(jù)可視化的最早和最強大的用法之一。現(xiàn)在各種疾病地圖是跟蹤流行病的標準工具。
因果關系
雖然地圖給了斯諾強有力的證據(jù),說明了供水的清潔是控制霍亂的關鍵,但是,為了使“污染的水導致疾病的傳播”這個科學論證有說服力,還有很長一段路要走。為了使案例更有說服力,他必須使用比較法。
科學家使用比較來確定實驗與結(jié)果之間的關聯(lián)。他們比較了一組接受實驗的個體(實驗組)的結(jié)果,和一組沒有接受實驗的個體的結(jié)果(對照組)。例如,現(xiàn)在的研究人員可能會比較死刑國家和沒有死刑的國家的平均謀殺率。
如果結(jié)果不同,那就是表明關聯(lián)的證據(jù)。但是為了確定因果關系,需要更加小心。
斯諾的“大實驗”
斯諾為自己在 Soho 中學到的東西感到鼓舞,他對霍亂的死亡情況做了更徹底的分析。一段時間中,他一直在收集倫敦一個地區(qū)的數(shù)據(jù),這里由兩家水廠服務。Lambeth 水廠從污水排入泰晤士河的地方的上游抽水。它的水比較干凈。但 Southwark and Vauxhall (S&V) 公司在污水排放的下游抽水,因此其供水受到污染。
下圖顯示了兩家公司所服務的地區(qū)。斯諾專注于兩個服務地區(qū)重疊的地方。
https://gitee.com/wizardforcel/data8-textbook-zh/raw/master/img/2-2.jpg
斯諾注意到,S&V 供應的人和 Lambeth 供應的人之間沒有系統(tǒng)的差別。 “每家公司都供應富人和窮人,大房子和小房子,接受不同公司的供水的人的狀況或職業(yè)并沒有差別......接受兩家公司供水的人或者房子都沒什么區(qū)別,它們周圍的物理狀況也沒什么區(qū)別...”
唯一的區(qū)別是供水方面,“一組供水含有倫敦的污水,其中有一些可能來自霍亂病人,另一組則不含。”
斯諾相信他能夠得出一個清楚的結(jié)論,斯諾在下表中總結(jié)了他的數(shù)據(jù)。
Supply Area | Number of houses | cholera deaths | deaths per 10,000 houses |
---|---|---|---|
S&V | 40,046 | 1,263 | 315 |
Lambeth | 26,107 | 98 | 37 |
Rest of London | 256,423 | 1,422 | 59 |
數(shù)字在指責 S&V。 S&V 供應的房屋的霍亂死亡率幾乎是 Lambeth 供應的房屋的十倍。
建立因果
用本節(jié)前面提出的語言,可以將 S&V 房屋中的人作為實驗組,Lambeth 房屋中的人作為對照組。斯諾的分析中的一個關鍵因素是,除了實驗組以外,兩組相互比較。
為了確定供水是否引起霍亂,斯諾必須比較兩個彼此相似的群體,它們只有一方面不同:供水。只有這樣,他才能夠?qū)⑵浣Y(jié)果的差異歸因于供水。如果這兩個群體在其他方面有所不同,那么就很難把供水視為疾病的來源。例如,如果實驗組由工廠工人組成,而對照組不是,那么兩組之間的結(jié)果之間的差異可能是由于供水,工廠工作或兩者兼有,或使兩組彼此不同的其它因素。最后的圖景會更加模糊。
斯諾的才智在于,確定可以使他的比較清晰的兩組。他開始著手建立水污染和霍亂感染之間的因果關系,并且在很大程度上他成功了,盡管瘴氣學說忽視甚至嘲笑他。當然,斯諾并不了解人類感染霍亂的詳細機制。這個發(fā)現(xiàn)是在 1883 年,當時德國科學家羅伯特·科赫(Robert Koch)分離出霍亂弧菌,這種霍亂弧菌是進入人體小腸并引起霍亂的細菌。
事實上,霍亂弧菌在 1854 年由意大利的菲利波·帕齊尼(Filippo Pacini)發(fā)現(xiàn),就在斯諾在倫敦分析他的數(shù)據(jù)的時候。由于意大利瘴氣學說的統(tǒng)治,帕齊尼的發(fā)現(xiàn)并不為人所知。但到了十九世紀末,瘴氣學說正在消失。隨后的歷史證明了帕齊尼和約翰·斯諾。斯諾的方法導致了流行病學領域的發(fā)展,它是疾病傳播的研究。
混淆
現(xiàn)在讓我們回到更現(xiàn)代化的時代,帶著我們一路上學到的重要經(jīng)驗:
在一項觀察研究中,如果實驗組和對照組在實驗以外的方面有所不同,則很難對因果關系作出結(jié)論。
兩組之間的根本區(qū)別(除了實驗)被稱為混淆因素,因為當你試圖得出結(jié)論時,它可能會混淆你(也就是搞砸你)。
示例:咖啡和肺癌。二十世紀六十年代的研究表明,喝咖啡的人患肺癌的比率高于不喝咖啡的人。因此,有些人認為咖啡是肺癌的一個原因。但咖啡不會導致肺癌。分析包含一個混淆因素 - 吸煙。在那些日子里,喝咖啡的人也可能是吸煙者,吸煙確實會導致肺癌。喝咖啡與肺癌有關,但不會導致疾病。
混淆因素在觀察研究中很常見。良好的研究需要非常小心,以減少混淆。
隨機化
避免混淆的一個很好的方法是,將個體隨機分配到實驗和對照組,然后將實驗給予分配到實驗組的人。隨機化使兩組除了實驗之外都相似。
如果你能夠?qū)€體隨機分為實驗組和對照組,你正在進行一項隨機對照試驗(RCT)。有時候,人們在實驗中的反應會受到他們知道他們在哪個群體的影響。所以你可能希望進行盲法實驗,其中個體不知道他們是在實驗組還是對照組。為了使它有效,你必須把安慰劑給控制組,這是一種和實驗看起來完全一樣的東西,但實際上沒有效果。
隨機對照實驗早已成為醫(yī)學領域的黃金標準,例如確定新藥是否有效。在經(jīng)濟學等其他領域也越來越普遍。
示例:墨西哥的福利補貼。在 20 世紀 90 年代的墨西哥村莊,貧困家庭的孩子往往沒有入學。其中一個原因是年齡較大的孩子可以上班,從而幫助家庭。墨西哥財政部長 Santiago Levy 著手調(diào)查福利項目是否可以用來提升入學率和改善健康狀況。他在一組村莊進行了一項隨機對照試驗,隨機選擇其中的一些來接受一個名為 PROGRESA 的新福利項目。如果他們的孩子定期上學,并且家庭使用了預防性醫(yī)療保險,那么這個項目會把錢捐給貧困家庭。如果孩子上中學而不是小學,會給他們更多錢,來補償孩子的工資損失,女孩上學比男孩給的更多。其余的村莊沒有得到這個實驗,并形成了對照組。由于隨機化,沒有銷魂因素,可以確定 PROGRESA 增加了入學率。對于男孩,入學率從對照組的 73% 上升到 PROGRESA 組的 77%。對于女孩來說,增長幅度更大,從對照組的 67% 增加到 PROGRESA 組的近75%。由于這個實驗的成功,墨西哥政府以 OPORTUNIDADES 這個新名稱支持這個項目,作為對一個健康和受過良好教育的人口的投資。
在某些情況下,即使目標是調(diào)查因果關系,也不可能進行隨機對照實驗。例如,假設你想研究懷孕期間飲酒的影響,你隨機將一些孕婦分配到你的“酒精”組。如果你給他們喝一杯,你不應該期待她們會合作。在這種情況下,你幾乎總是在進行觀察研究,而不是實驗。要警惕混淆因素。
尾注
根據(jù)我們開發(fā)的術(shù)語,約翰·斯諾進行了一項觀察研究,而不是一個隨機的實驗。但是他把自己的研究稱為“大實驗”,因為他寫道:“至少三十萬人......被分成兩組,他們無法選擇,在大多數(shù)情況下,他們并不知情......”
斯諾的這種研究有時被稱為“自然實驗”。然而,真正的隨機化并不僅僅意味著,實驗和對照組“在他們無法選擇的情況下”進行選擇。
隨機化的方法可以像擲硬幣一樣簡單。它也可能更復雜一點。但是隨機化的每一種方法都是由一系列精心定義的步驟組成的,這些步驟允許幾率以數(shù)學方式指定。這有兩個重要的結(jié)果。
它使我們能夠以數(shù)學方式,計算隨機化產(chǎn)生實驗和對照組的可能性。
它使我們能夠?qū)嶒灲M和對照組之間的差異作出精確的數(shù)學表述。這反過來幫助我們對實驗是否有效作出正確的結(jié)論。
在本課程中,你將學習如何進行和分析你自己的隨機實驗。這將涉及比本節(jié)更多的細節(jié)。目前,只需關注主要思想:嘗試建立因果關系,如果可能,進行隨機對照實驗。如果你正在進行一項觀察研究,你可能能夠建立聯(lián)系而不是因果關系。在根據(jù)觀察研究得出因果關系的結(jié)論之前,要非常小心混淆因素。
術(shù)語
- observational study:觀察研究
- treatment:實驗
- outcome:結(jié)果
- association:關聯(lián)/聯(lián)系
- causal association:因果聯(lián)系
- causality:因果(關系)
- comparison:比較
- treatment group:實驗組
- control group:對照組
- epidemiology:流行病學/傳染病學
- confounding:混淆
- randomization:隨機化
- randomized controlled experiment:隨機對照實驗
- randomized controlled trial (RCT):隨機對照實驗
- blind:盲法
- placebo:安慰劑
有趣的事實
約翰·斯諾有時被稱為流行病學之父,但他是專業(yè)的麻醉師。 他的病人之一是維多利亞女王,她是分娩時麻醉劑的早期接受者。
弗洛倫斯·南丁格爾,現(xiàn)代護理實踐的創(chuàng)始人,因其在克里米亞戰(zhàn)爭中的工作而聞名,是一位頑固瘴氣主義者。 她沒有時間研究傳染病和細菌的理論,也沒有時間講述她的話。 她說:“與這個學說相關的荒謬是無窮無盡的。一言以蔽之,從一般意義上說,沒有任何科學研究可以接受的證據(jù)表明,存在傳染病這樣的事情。”
后來的隨機對照試驗表明,PROGRESA 堅持的條件 - 孩子上學,預防性醫(yī)療保險 - 對于提升入學率沒有必要。 只是提高福利金就足夠了。
擴展閱讀
The Strange Case of the Broad Street Pump: John Snow and the Mystery of Cholera 由 Sandra Hempel 所著,加利福尼亞大學出版社出版,讀起來像是偵探小說。 這是本節(jié)中約翰·斯諾和他的工作的主要來源之一。 一些警告:這本書的一些內(nèi)容令人反胃。
Poor Economics 由 MIT 的 Abhijit V. Banerjee 和 Esther Duflo 所著的暢銷書,是對抗全球貧困的方式的易理解的真實記錄。 它包含了很多 RCT 的例子,包括本節(jié)中的 PROGRESA 示例。