? ??????????????
SPSS使用logistic回歸的步驟:
1.圖形分析(條形圖)
2.卡方分析(原理)
3.logistic回歸分析
4.混淆矩陣分析(類似線性回歸中的殘差分析)
5.應用
下面將使用bankloan_binning(提取碼:78uh)進行分析:
0.數據集分析---略
1.圖形分析
分析y與一個x的關系:
------分類與分類
輸出結果:
圖中可輕易看出占比關系,違約和年齡分組存在關系
------分類與連續
均值顯著不等,不相關
2.相關分析
2.1 分類與分類------卡方分析
------了解列聯表
結果如下:
p值小于0.05,相關性顯著
2.2 分類與連續------方差分析?
3.logistic回歸分析
輸出窗口為:
說明,樣本數和因變量取值
可以直接跳過
0.27模型準確度有待提高
刪除不顯著的變量
修改后的模型(思考:β為負數怎么解釋?若解釋增加3000元錢呢?---e的3β次方)
4. 混淆矩陣(敏感度解釋)
增加敏感度的方法:工具變量法(增加一個變量x將原本是1但被預測為0的那一行的x取值為1,其余取值為0,尋找與x高相關的特征值將他加入模型)
附加:
這個指總體預測準確率
一個應用原則:
1.回歸分析通常對x不做假設
2.線性回歸擅長處理連續x;logistic回歸擅長處理分類x
3.統計學習模型擅長處理連續x(小數據);機器學習模型擅長處理分類x(大數據)
4.在統計學習模型中,如果需要解釋x與y之間的關系,x建議分類;如果不需要解釋x與y之間的關系,x建議連續;在機器學習模型中,也一樣。
5.但是,在統計學習中通常不建議對x做分類;機器學習中,通常建議對x做分類。