該案例來自于金融理論與政策小組作業——《基于分省數據研究宏觀變量對房地產價格的影響》,我主要負責對房地產長周期影響因素進行回歸分析。由于我們采用的是面板數據,第一次做這樣的分析,Stata也是從零基礎開始,把過程記錄下來作為以后研究的基礎。
房地產的一個完整周期大致為30年,我國商品房市場從1998年正式開始,發展至今也不過走了長周期的一半。房地產價格長周期主要受經濟增長、城市化、人口數量和結構等影響,短周期主要受金融政策影響(利率、抵押貸首付比、稅收、土地政策等)。下面這張圖以上海房價數據為例形象地表現了各階段的發展特點:
面板數據用Stata處理比較方便,導入數據前需要處理成特定格式,比如第一列為省份數據(31個省),第二列為年份數據(1995-2015年度數據),第三列為因變量(房價),第四至n列為解釋變量(人均GDP、人口、城鎮化率、土地價格、利率等)。
首先,我們采用固定效應回歸模型,在回歸方程中截距項只和個體有關,也就意味著認為省份之間的差異不隨時間發生改變。Stata代碼如下:
xtset province, year
xtreg ln_hp gdp_capita population cityl ln_land rate, fe
est store fixed
上述回歸結果主要關注幾項指標:總體R2為0.8962,回歸較為顯著;corr(u_i, Xb)為個體效應和解釋變量之間的相關系數,該值接近0時比較適合采用隨機效應回歸模型;回歸P值小于0.05可以認為是顯著的,這里回歸顯示人口因素不顯著;sigma_u代表個體效應的標準差,sigma_e代表干擾項的標準差,rho為個體效應的波動占總波動的比率,這里為85%左右。
接下來再采用隨機效應回歸模型,它的優勢是增加了同時與個體和時間相關的因子,但更加復雜,Stata代碼如下:
xtreg ln_hp gdp_capita population cityl ln_land rate, re
est store random
隨機效應回歸模型的參數同上,也可以看出人口因素回歸是不顯著的。
那么,到底采用哪種模型更為合適,就可以通過Hausman檢驗來進行評判。前面我們已經將兩個模型分別儲存為fixed和random,因此Hausman檢驗的Stata代碼如下:
hausman fixed random
這里最重要的還是檢驗P值,P<0.05說明可以拒絕原假設(隨機效應回歸模型),因此我們的模型采用固定效應回歸模型更為合適。
剛才也提到了,人口因素回歸是不顯著的,因此我們將這個解釋變量刨去,再用固定效應回歸模型進行回歸分析。
xtreg ln_hp gdp_capita cityl ln_land rate, fe
這里我們可以關注一下Coef.,回歸結果為:人均GDP每增加一千元,房價大致上漲9%;城鎮化率每增加1%,房價大致上漲2.7%;土地價格每增加1%,房價大致上漲0.18%;利率每增加1%,房價大致上漲6%。
采用固定效應回歸模型還有一個好處,就是我們可以通過設置虛擬變量的方式分別進行時間固定效應回歸和個體固定效應回歸,以此發現是否存在有差異的時間段或個體。首先是時間方面:
tab year, gen(yr)
drop yr1
reg ln_hp gap_capita cityl ln_land rate yr*
yr14,yr15對應的是2008-2009年,這段時間由于多次降準降息,以及國家四萬億基建投資,房地產價格經歷了快速上漲階段,這些是難以用長期驅動因素來分析的,屬于異常值;yr20對應2014年,可見2014-2016年這段時間房價上漲也偏離了長期合理價位。
其次進行個體效應分析:
tab province, gen(dum)
drop dum1
reg ln_hp gap_capita cityl ln_land rate dum*
dum2對應的是天津省,dum5對應的是內蒙古,這兩個值出現異常其實是蠻奇怪的,因為我之前自己的預測是北上廣等地區會出現偏差,這是否說明這些地區房價從長期來看其實是很合理的?對于天津和內蒙古,查了一下數據是覺得它們的人均GDP漲幅很快,但是房價上漲并沒有那么明顯,可能是這個原因導致出現異常。
短周期影響方面,我也嘗試進行了回歸,時間段為2014.3-2016.9季度數據。比較麻煩的一點是excel復制過去的時間數據是string格式,要變換成Stata認可的季度數據格式還費了一些周折,過程如下:
gen time1 = date( time, "YMD")
format time1 %td
gen time2 = qofd(time1)
format time2 %tq
接下來,將房價與短周期的影響因素(利率、貸款總量、社融規模)進行了回歸,同樣采用固定效應回歸模型:
xtset province time2
xtreg hp rate loan financing, fe
可以發現,總體的R2只有0.14,不夠顯著。短周期來看,利率和房價是反相關的,而我們長期回歸參數確是正的,這似乎也說明了利率的兩種不同影響機制(即影響房地產開發商的借貸成本—正相關,也影響購房者的借貸成本—負相關)。
大致的分析過程就是這樣,由于水平非常有限,目前只能做到這樣。希望之后能有機會好好學一學金融計量,定量研究一定還是有它的價值所在的!