SPSS之logistic回歸

? ??????????????log(p/(1-p))=\beta_0+\beta_1x_1+\beta_2x_2+\varepsilon

SPSS使用logistic回歸的步驟:

1.圖形分析(條形圖)

2.卡方分析(原理)

3.logistic回歸分析

4.混淆矩陣分析(類似線性回歸中的殘差分析)

5.應用

下面將使用bankloan_binning(提取碼:78uh)進行分析:

0.數據集分析---略

1.圖形分析

分析y與一個x的關系:

------分類與分類

輸出結果:


圖中可輕易看出占比關系,違約和年齡分組存在關系

------分類與連續


均值顯著不等,不相關

2.相關分析

2.1 分類與分類------卡方分析

------了解列聯表

\chi^2=\sum_1^k \frac{(f_i-\overline{f_i})}{\overline{f_i}} \sim \chi^2((行數-1)(列數-1 ))



結果如下:


p值小于0.05,相關性顯著

2.2 分類與連續------方差分析?


3.logistic回歸分析




輸出窗口為:


說明,樣本數和因變量取值


可以直接跳過


0.27模型準確度有待提高


刪除不顯著的變量


修改后的模型(思考:β為負數怎么解釋?若解釋增加3000元錢呢?---e的3β次方)

4. 混淆矩陣(敏感度解釋)


增加敏感度的方法:工具變量法(增加一個變量x將原本是1但被預測為0的那一行的x取值為1,其余取值為0,尋找與x高相關的特征值將他加入模型)

附加:




這個指總體預測準確率


一個應用原則:

1.回歸分析通常對x不做假設

2.線性回歸擅長處理連續x;logistic回歸擅長處理分類x

3.統計學習模型擅長處理連續x(小數據);機器學習模型擅長處理分類x(大數據)

4.在統計學習模型中,如果需要解釋x與y之間的關系,x建議分類;如果不需要解釋x與y之間的關系,x建議連續;在機器學習模型中,也一樣。

5.但是,在統計學習中通常不建議對x做分類;機器學習中,通常建議對x做分類。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容