本文是在我在這學期聽了北京大學國發院2019年春季學期沈艷老師開設的《高級計量經濟學2》后對因果推斷部分的總結,主要涉及DID、RD、傾向得分匹配、HCW及合成控制法等計量方法。
因為文章包含了很多我個人的理解,免不了有所疏漏或者有理解不到位之處,還請大家批評指正。大家如果有興趣對因果推斷的方法進一步探究,可以閱讀我在文章最下方列出的課程參考文獻以及我自己認為對理解因果推斷很有幫助的一些文章。
首先,什么是因果推斷?我認為因果推斷是用已有的證據去證明兩件事、兩個變量之間的因果聯系,比如證明教育年限對于工資水平的影響,或者是氣候變化對于農作物產量的影響,這里的教育年限和氣候變化就是因,而工資水平和農作物產量則是果。
用于驗證因果關系最理想的辦法,自然是做實驗。繼續上文教育年限和工資水平的例子,我們如果想證明教育年限對于工資水平有影響,在理想狀態下應該找一群人,控制他們的性別、年齡、智商等等所以可能影響工資水平的因素不變化,而只讓教育年限發生變化,來觀察工資水平是否會發生變化以及發生多大的變化。但現實中,尤其是對于社會學科來說,通常的研究對象是人,很難像自然科學一樣在可以對各變量進行嚴格控制的環境下進行實驗,所以就又有了下面我們要講的方法。
第一種是隨機控制實驗(random control trial),也就是近些年比較火的RCT方法。用藥品測試作為例子,為了測試某種新藥到底有沒有效果,藥品公司招募了一批符合條件的被試者,將這些被試者隨機分入控制組或者實驗組??刂平M僅發放安慰劑,而實驗組則會發放真正的藥品,但是被試者并不知道發放到自己手中的藥品究竟是安慰劑還是開發的新藥。在實驗結束以后,對比實驗組與控制組的相應身體指標,二者之間的平均差異就是新藥的效果。
第二種是自然實驗(natural experiment)或者準實驗(quasi-experiment)。這類實驗主要是指由于某些外部突發事件,使得當事人仿佛隨機地被分配到了實驗組和控制組,因而可以進行比較,探究是否存在因果關系。通過個體分組是否完全取決于這一突發事件,我們又可以進一步將其分為兩類實驗:第一類個體分組完全取決于突發事件,比如1992年,美國新澤西州通過法律將最低工資從每小時4.25美元提高到5.05美元,但在相鄰的賓夕法尼亞州最低工資依然保持不變,這兩個州的雇主仿佛被隨機地分配到實驗組(新澤西州)與控制組(賓夕法尼亞州)。這類自然實驗可以直接用OLS估計因果效應。第二類個體分組只是部分地由自然實驗所決定,如Angrist(1990) 考察越戰期間的參軍者,當時美國對全國年輕男子以生日抽簽的方式進行征兵,盡管抽簽完全隨機,但是否參軍取決于體檢,且有些人得到豁免,另一些人未抽中卻自愿參軍,此時應以自然實驗所帶來的隨機變動作為工具變量。
那在介紹完以上的實驗之后,我們正式進入因果推斷的框架。我們這里主要用到的是RCM的模型,即Rubin Causal Model (RCM; Rubin 1978)。首先我們引入潛在因變量的概念。
什么叫做潛在因變量呢?例如一個人上了大學,我們想研究上大學這一事件對于他的收入帶來了多大的提升,這一提升叫做上大學這一事件的處理效應。為了計算這一處理效應,我們就要對這個人上了大學的收入和沒上大學的收入兩者相減。但在實際情況中,我們只能觀察到他上了大學的收入,而無法觀察到他沒上大學的話收入是多少,因為一個人無法像薛定諤的貓一樣同時兼具兩種狀態,要么是生,要么是死,一旦一種狀態被確定,另一種狀態下發生的事情就無法觀測到了。此時,這個無法觀測到的因變量就叫做潛在因變量。那我們引入以下的一些notation。
接下來我們就要定義所謂的處理效應。因為總體可以分為實驗組和控制組,相應在總體、實驗組和控制組三個層面上就有三種處理效應。用我們上面提到的總體處理效應是指總體隨機分配個體到實驗組與控制組所得到的處理效應,即。而實驗組處理效應為
??刂平M的處理效應為
。這三者之間的關系是
,即總體處理效應是實驗組處理效應與控制組處理效應的權重加總。
在現實中由于潛在因變量的問題,我們往往無法估計以上三種處理效應。我們往往通過比較實驗組與處理組的平均差異來近似個體處理效應,即:
當趨于無窮時,該值依概率收斂于
,經過一番操作后可以化為
第一個花括號內即為實驗組的處理效應,第二個花括號內是由實驗組和控制組解釋變量差異帶來的混淆效應,即實驗組和控制組個體本身的異質性,第三個花括號內是實驗組和控制組個體不可觀測因素帶來的偏差。
為了使估計的總體處理效應在期望上等于實驗組的處理效應,我們需要引入以下兩個假定:
Assumption 1:
Assumption 2:
第一個假定表明在控制了解釋變量之后,實驗組與控制組個體的選擇與潛在因變量獨立。第二個假定叫做重合假定,表明實驗組與控制組應當在一個范圍內都有觀測值。這兩個假定合起來稱為“the strongly ignorable treatment assignment”假定。
如果以上兩個假定成立,那么我們就可以選用回歸、傾向得分匹配的方法。反之,則根據需要選用工具變量、DID、RD、HCW、合成控制法等。
除了假定以外,實驗組分配機制也是決定我們能否使用因果推斷以及使用哪種因果推斷方法的重要因素。一般而言,我們都需要考慮實驗組分配機制是否存在內部有效性和外部有效性的問題。內部有效性問題主要包含:1)未能完全隨機分組;2)未能完全遵從實驗設計;3)中途退出實驗;4)觀察效應或霍桑效應,即觀察者會給實驗者的行為造成擾動;5)樣本量過小。內部有效性問題主要存在于實驗設計本身,而外部有效性問題影響實驗結果是否能夠推廣,具有參考價值和普遍的代表性,主要包括:1)樣本代表性不足;2)小型實驗的條件與大規模推廣時的現實條件不同;3)一般均衡效應,以市場供需為例,市場在達到均衡與未達到均衡時供需機制顯然是不同的;4)自我選擇效應,以就業培訓項目為例,選擇進入就業培訓項目的人往往在近幾年收入較低,因此研究就業培訓項目對收入的影響就會存在內生性問題。
因為文章比較長,所以我們這部分就先介紹RCM基本框架,接下來依次為大家介紹這一框架下不同的因果推斷方法。
相關網頁:
Rubin Causal Model (RCM) 和隨機化試驗(作者寫的一系列關于因果推斷的文章可讀性很不錯,大家有興趣可以一覽)