如何利用計量經濟學的方法進行因果推斷(一)

本文是在我在這學期聽了北京大學國發院2019年春季學期沈艷老師開設的《高級計量經濟學2》后對因果推斷部分的總結,主要涉及DID、RD、傾向得分匹配、HCW及合成控制法等計量方法。

因為文章包含了很多我個人的理解,免不了有所疏漏或者有理解不到位之處,還請大家批評指正。大家如果有興趣對因果推斷的方法進一步探究,可以閱讀我在文章最下方列出的課程參考文獻以及我自己認為對理解因果推斷很有幫助的一些文章。



首先,什么是因果推斷?我認為因果推斷是用已有的證據去證明兩件事、兩個變量之間的因果聯系,比如證明教育年限對于工資水平的影響,或者是氣候變化對于農作物產量的影響,這里的教育年限和氣候變化就是因,而工資水平和農作物產量則是果。

用于驗證因果關系最理想的辦法,自然是做實驗。繼續上文教育年限和工資水平的例子,我們如果想證明教育年限對于工資水平有影響,在理想狀態下應該找一群人,控制他們的性別、年齡、智商等等所以可能影響工資水平的因素不變化,而只讓教育年限發生變化,來觀察工資水平是否會發生變化以及發生多大的變化。但現實中,尤其是對于社會學科來說,通常的研究對象是人,很難像自然科學一樣在可以對各變量進行嚴格控制的環境下進行實驗,所以就又有了下面我們要講的方法。

第一種是隨機控制實驗(random control trial),也就是近些年比較火的RCT方法。用藥品測試作為例子,為了測試某種新藥到底有沒有效果,藥品公司招募了一批符合條件的被試者,將這些被試者隨機分入控制組或者實驗組??刂平M僅發放安慰劑,而實驗組則會發放真正的藥品,但是被試者并不知道發放到自己手中的藥品究竟是安慰劑還是開發的新藥。在實驗結束以后,對比實驗組與控制組的相應身體指標,二者之間的平均差異就是新藥的效果。

第二種是自然實驗(natural experiment)或者準實驗(quasi-experiment)。這類實驗主要是指由于某些外部突發事件,使得當事人仿佛隨機地被分配到了實驗組和控制組,因而可以進行比較,探究是否存在因果關系。通過個體分組是否完全取決于這一突發事件,我們又可以進一步將其分為兩類實驗:第一類個體分組完全取決于突發事件,比如1992年,美國新澤西州通過法律將最低工資從每小時4.25美元提高到5.05美元,但在相鄰的賓夕法尼亞州最低工資依然保持不變,這兩個州的雇主仿佛被隨機地分配到實驗組(新澤西州)與控制組(賓夕法尼亞州)。這類自然實驗可以直接用OLS估計因果效應。第二類個體分組只是部分地由自然實驗所決定,如Angrist(1990) 考察越戰期間的參軍者,當時美國對全國年輕男子以生日抽簽的方式進行征兵,盡管抽簽完全隨機,但是否參軍取決于體檢,且有些人得到豁免,另一些人未抽中卻自愿參軍,此時應以自然實驗所帶來的隨機變動作為工具變量。

那在介紹完以上的實驗之后,我們正式進入因果推斷的框架。我們這里主要用到的是RCM的模型,即Rubin Causal Model (RCM; Rubin 1978)。首先我們引入潛在因變量的概念。

什么叫做潛在因變量呢?例如一個人上了大學,我們想研究上大學這一事件對于他的收入帶來了多大的提升,這一提升叫做上大學這一事件的處理效應。為了計算這一處理效應,我們就要對這個人上了大學的收入和沒上大學的收入兩者相減。但在實際情況中,我們只能觀察到他上了大學的收入,而無法觀察到他沒上大學的話收入是多少,因為一個人無法像薛定諤的貓一樣同時兼具兩種狀態,要么是生,要么是死,一旦一種狀態被確定,另一種狀態下發生的事情就無法觀測到了。此時,這個無法觀測到的因變量就叫做潛在因變量。那我們引入以下的一些notation。

接下來我們就要定義所謂的處理效應。因為總體可以分為實驗組和控制組,相應在總體、實驗組和控制組三個層面上就有三種處理效應。用我們上面提到的總體處理效應是指總體隨機分配個體到實驗組與控制組所得到的處理效應,即\tau_{P}=E\left[Y_{i}(1)-Y_{i}(0)\right]。而實驗組處理效應為\tau_{P T}=E\left[Y_{i}(1)-Y_{i}(0) | W=1\right]??刂平M的處理效應為\tau_{U T}=E\left[Y_{i}(1)-Y_{i}(0) | W=0\right]。這三者之間的關系是\tau_{P}=\operatorname{Pr}(W=1) \tau_{P T}+\operatorname{Pr}(W=0) \tau_{U T},即總體處理效應是實驗組處理效應與控制組處理效應的權重加總。

在現實中由于潛在因變量的問題,我們往往無法估計以上三種處理效應。我們往往通過比較實驗組與處理組的平均差異來近似個體處理效應,即:

\frac{1}{N_{T}} \sum_{i : W_{i}=1}^{N} Y_{i}-\frac{1}{N-N_{T}} \sum_{i : W_{i}=0}^{N} Y_{i}

N \text { and } N_{T}趨于無窮時,該值依概率收斂于E\left(Y_{i} | W_{i}=1\right)-E\left(Y_{i} | W_{i}=0\right),經過一番操作后可以化為

\begin{array}{l}{\left\{E\left[m_{1}(X)-m_{0}(X) | W=1\right]\right\}}  {+\left\{E\left(m_{0}(X) | W=1\right)-E\left(m_{0}(X) | W=0\right)\right\}}  {+\{E[\varepsilon(1) | W=1]-E[\varepsilon(0) | W=0]\}}\end{array}

第一個花括號內即為實驗組的處理效應,第二個花括號內是由實驗組和控制組解釋變量差異帶來的混淆效應,即實驗組和控制組個體本身的異質性,第三個花括號內是實驗組和控制組個體不可觀測因素帶來的偏差。

為了使估計的總體處理效應在期望上等于實驗組的處理效應,我們需要引入以下兩個假定:

Assumption 1:\left(Y_{i}(0), Y_{i}(1)\right) \perp W_{i} | X_{i}

Assumption 2:0<\operatorname{Pr}\left(W_{i}=1 | X_{i}\right)<1

第一個假定表明在控制了解釋變量之后,實驗組與控制組個體的選擇與潛在因變量獨立。第二個假定叫做重合假定,表明實驗組與控制組應當在一個范圍內都有觀測值。這兩個假定合起來稱為“the strongly ignorable treatment assignment”假定。

如果以上兩個假定成立,那么我們就可以選用回歸、傾向得分匹配的方法。反之,則根據需要選用工具變量、DID、RD、HCW、合成控制法等。

除了假定以外,實驗組分配機制也是決定我們能否使用因果推斷以及使用哪種因果推斷方法的重要因素。一般而言,我們都需要考慮實驗組分配機制是否存在內部有效性和外部有效性的問題。內部有效性問題主要包含:1)未能完全隨機分組;2)未能完全遵從實驗設計;3)中途退出實驗;4)觀察效應或霍桑效應,即觀察者會給實驗者的行為造成擾動;5)樣本量過小。內部有效性問題主要存在于實驗設計本身,而外部有效性問題影響實驗結果是否能夠推廣,具有參考價值和普遍的代表性,主要包括:1)樣本代表性不足;2)小型實驗的條件與大規模推廣時的現實條件不同;3)一般均衡效應,以市場供需為例,市場在達到均衡與未達到均衡時供需機制顯然是不同的;4)自我選擇效應,以就業培訓項目為例,選擇進入就業培訓項目的人往往在近幾年收入較低,因此研究就業培訓項目對收入的影響就會存在內生性問題。

因為文章比較長,所以我們這部分就先介紹RCM基本框架,接下來依次為大家介紹這一框架下不同的因果推斷方法。



相關網頁:

Rubin Causal Model (RCM) 和隨機化試驗(作者寫的一系列關于因果推斷的文章可讀性很不錯,大家有興趣可以一覽)

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,578評論 6 544
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,701評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 178,691評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,974評論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,694評論 6 413
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 56,026評論 1 329
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,015評論 3 450
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 43,193評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,719評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,442評論 3 360
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,668評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,151評論 5 365
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,846評論 3 351
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,255評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,592評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,394評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,635評論 2 380

推薦閱讀更多精彩內容