期末了...所以比較忙,貼篇10月份的讀書筆記
因果推斷的關鍵是控制住干擾因果關系的可觀察因素。如果該因素是觀察不到的,那可以嘗試使用前面的工具變量法。但是良好的工具變量一般不易找到,因此需要一些其他手段來處理這些不可觀察的干擾因素:如個體固定效應、雙重差分。
例如我們研究收入和教育間的關系:
教育年限會影響收入y,但是觀察不到的因素u(個人能力等)也會通過教育年限影響收入y。此時我們估計出的參數β1就不準確(測度教育對收入的影響)。之所以不能準確估計出參數,原因主要是我們的信息不足,我們無法找到一個完全代表教育的信息來測量教育對收入的影響。
在橫截面數據結構下,我們會選擇工具變量更加準確地估計β1。在本例中我們可以引入母親的教育年限來作為工具變量(根據已有的研究知道,母親的教育年限會影響孩子的教育年限,但是母親的教育年限不會影響到孩子個人的能力)。此時引入母親教育年限這一個新信息會使使得信息更充分。
在面板數據中,我們引入固定效應的概念。個體固定效應指考慮個體在未受到干預時表現出的趨勢特征,然后在處理組和控制組將這種趨勢特征控制,最后比較兩者的水平差異。
固定效應是針對面板數據的處理手段。面板數據和橫截面數據的區別在于面板多了一個時間維度,即一個人處理能橫向地和同時間的其他人比較,也可以縱向的很之前之后的自己比較。如果把一個人在不同時間的數據稱為一組數據的話。那么前者稱為組間差異、后者稱為組內差異。此時,如果要估計出準確的參數,組間和組內的差異都要考慮到,不然這些擾動因素就會干擾到對參數的估計。
在本例中,因為多了時間維度的數據,我們對研究對象的信息掌握的更加充分了,在估計時不再需要借助該人以外的其他信息了。
固定效應的辦法即給每個人單獨創造出一個名義變量(0-1變量),這個名義變量可以看做是承載此人所有不隨時間變化的特質的集合。當把這個名義變量代入回歸方程進行回歸時,相當于吸走了每個人不隨時間變化的特質組間差異,只留下了組內差異。
上面我們研究的是個體固定效應模型,即解決了不隨時間而變但隨個體而異的遺漏變量問題。但還可能存在不隨個體而變,但隨時間而變的遺漏變量問題,此時需要引入時間固定效應模型。同樣地我們以研究收入和教育的關系,考慮不同時間上有不同的教育政策影響人們受教育程度,為了簡便不考慮個體層面的固定效應,即假設每個人能力上幾乎沒有差異。
以上我們討論了單獨的個體固定效應和單獨的時間固定效應,即“單向固定效應”。如果同時考慮個體和時間固定效應,稱為”雙向固定效應“。此時我們可以通過檢驗這些虛擬變量的聯合顯著性來判斷是否應該使用雙向固定效應模型。
參考資料:
- 《基本無害的計量經濟學》
- 固定效應模型與隨機效應模型的區別
- 面板數據