背景介紹 數據集包含歐洲持卡人于2013年9月通過信用卡進行的交易。這個數據集顯示了兩天內發生的交易,在284,807筆交易中我們有492筆詐騙。數據集非常不平衡,正面類(欺...

理論說完了,來次實踐。 數據理解與預處理 數據來自kaggle的Give Me Some Credit項目,有15萬條的樣本數據。要求根據歷史數據,預測申請人違約的可能性,以...
模型開發步驟 業務和風險定義 數據準備與預處理來源:自有數據和第三方數據 模型構建確定觀察點、觀察期和表現期,選擇特征建模。 模型評估準備測試集進行驗證。評估標準:ROC:評...
貸前流程: 用戶申請:一般在該階段會要求客戶填寫一些信息,評分卡建模的部分特征從這些信息當中提取,再結合其他來源的數據進行補充。 準入規則:一般根據國家和行業要求,結合公司政...
信用風險 百科的釋義是:信用風險(Credit Risk)又稱違約風險,是指交易對手未能履行約定契約中的義務而造成經濟損失的風險,即受信人不能履行還本付息的責任而使授信人的預...
在線性回歸的基礎上,如果因變量不是連續變量,而是0-1變量,怎么辦呢?這里我們需要一個閾值函數,將因變量的取值做一下劃分,映射成0-1變量。回歸算法就加了一個sigmoid函...
線性回歸是我們接觸得最早的一種回歸,只是當時他的名字不叫線性回歸,當時可能說的是線性擬合。Y=aX+b+e沒有看錯,就是這貨,一元線性回歸。這里Y是連續變量,a和b是參數,e...
最近打算采用關系型數據庫來理一下公司的運營數據,先拿點東西練手找感覺。下面是幾個關于學生課業的表,需要建立一個數據庫,含有以下四張表,在此基礎上做練習。 表結構 第一行為表名...
【目錄】 建模 邏輯回歸 邏輯回歸算法是一種很常用的用于二分類的分類算法,我們先用邏輯回歸模型試一試。scikit-learn這個包中含有絕大部分數據挖掘需要用到的算法,可以...
【目錄】 問題背景 船沉了,大家驚慌逃生,但是沒有足夠的救生艇。是否獲救并非隨機,有些群體比其他人更有可能生存,如婦女、兒童和上層階級等等。 數據集是乘客的個人信息以及存活狀...
處理數據前需先將數據導入庫中,此處為指定網絡位置的數據資源,通過urllib2包處理 數據包含鳶尾花(iris)數據集,這是一個包含了三種鳶尾花(山鳶尾、維吉尼亞鳶尾和變色鳶...