銀行數(shù)據(jù)倉庫體系實踐(18)--數(shù)據(jù)應(yīng)用之信用風險建模

信用風險

????????銀行的經(jīng)營風險的機構(gòu),那在第15節(jié)也提到了巴塞爾新資本協(xié)議對于銀行風險的計量和監(jiān)管要求,其中信用風險是銀行經(jīng)營的主要風險之一,它的管理好壞直接影響到銀行的經(jīng)營利潤和穩(wěn)定經(jīng)營。信用風險是指交易對手未能履行約定契約中的義務(wù)而給銀行造成經(jīng)濟損失的風險。典型的表現(xiàn)形式包括借款人發(fā)生違約或信用等級下降。借款人因各種原因未能及時、足額償還債務(wù)/銀行貸款、未能履行合同義務(wù)而發(fā)生違約時,債權(quán)人或銀行必將因為未能得到預(yù)期的收益而承擔財務(wù)上的損失。

????????那如何來表示某個交易對手的信用情況呢,一般使用信用等級或信用評分來來表示,等級越低或評分越低,發(fā)生違約的概率會增加。這個信用評分主要應(yīng)用在客戶的貸前和貸后管理中,貸前是指客戶貸款申請階段,銀行受理客戶貸款申請時會根據(jù)客戶提交的信息、人行征信、其它數(shù)據(jù)源按一定的規(guī)則計算出一個違約概率和風險評分或信用等級。再根據(jù)這個評分或評級來確定客戶的授信額度和利率。計算出的評分或評級越高,違約概率越低,比如在進行個人貸前評分時主要關(guān)注以下5方面:

????????(1)People:貸款人狀況,包括歷史還款表現(xiàn)、當前負債情況、資金饑渴度等;

????????(2)Payment:還款來源,如基本收入、資產(chǎn)水平、月收支負債比、無擔保總負債等;???????

????????(3)Purpose:資金用途,如消費、買房,需要規(guī)避貸款資金用于投資或投機性質(zhì)較高領(lǐng)域,如股票和數(shù)字貨幣;

????????(4)Protection:債權(quán)確保,主要是看是否有抵押物或擔保,需要看抵押物用途、質(zhì)量、價格等關(guān)鍵要素;

????????(5)Perspective:借款戶展望,從地域、行業(yè)、人生階段等考察穩(wěn)定性及潛力;

????????貸后是指客戶借款后銀行持續(xù)跟進客戶的信用情況,如果發(fā)現(xiàn)信用評分降低或者某些指標達到風險預(yù)警指標的閾值,說明風險升高,則會進行凍結(jié)額度甚至提前進行貸款收回。特別是對于逾期客戶。


風險建模步驟

?????? 在進行信用評估時如何選擇客戶屬性、如何確定評分或評級規(guī)則呢?這就需要進行風險建模,通過分析歷史數(shù)據(jù)來確定哪些特征或指標對客戶的違約相關(guān)性大,可以了解客戶的還款能力以及還款意愿。并通過一定方法來建立評分和評級的規(guī)則。那風險建模主要分為以下步驟:

????????(1)業(yè)務(wù)理解:主要評估當前現(xiàn)狀、確定業(yè)務(wù)目標,選擇建模方法,比如需要進行XX貸款產(chǎn)品的貸前評分模型并確定準入規(guī)則,建模方式比如為評分卡,評分應(yīng)用為基于評分確定貸款準入規(guī)則以及額度和利率規(guī)則,同時需要確定分析數(shù)據(jù)的好客戶和壞客戶標準,如逾期90天以上為壞客戶;

????????(2)數(shù)據(jù)理解:首先需要準備建模的樣本數(shù)據(jù),如抽取近2年的獲得類似產(chǎn)品的客戶相關(guān)信息以及根據(jù)好客戶和壞客戶標準確定的結(jié)果。并針對業(yè)務(wù)數(shù)據(jù)進行業(yè)務(wù)含義理解、對數(shù)據(jù)進行收集、探索,了解每個變量的數(shù)據(jù)質(zhì)量、缺失情況,數(shù)據(jù)分布等。比如對于客戶在人行的征信數(shù)據(jù)、客戶在銀行的存款、理財?shù)刃畔ⅰ⒁约翱蛻羯暾執(zhí)顚懙募彝ァ⒎慨a(chǎn)信息、外部獲得的客戶教育、司法等相關(guān)信息進行業(yè)務(wù)理解和數(shù)據(jù)分布、質(zhì)量的探索,對缺失值比例過大的變量或準確性不高的變量進行剔除,同時也要確定對于樣本數(shù)據(jù)中哪些數(shù)據(jù)進行建模,哪些數(shù)據(jù)進行驗證。

????????(3)數(shù)據(jù)準備:主要對數(shù)據(jù)進行預(yù)處理和指標加工,指標加工指基于基礎(chǔ)數(shù)據(jù)進行指標加工,如最近1個月的征信查詢次數(shù),最近1年的逾期次數(shù)等,數(shù)據(jù)預(yù)處理主要工作包括對每一個變量進行數(shù)據(jù)清洗、缺失值處理、異常值處理、數(shù)據(jù)標準化等,主要目的是將獲取的原始數(shù)據(jù)轉(zhuǎn)變成可用于建模的結(jié)構(gòu)化數(shù)據(jù)。

????????比如對于連續(xù)變量,就是要尋找合適的切割點把變量分為幾個區(qū)間段以使其具有最強的預(yù)測能力,也稱為“分箱”。例如客戶年齡就是連續(xù)變量,在這一步就是要研究分成幾組、每組切割點在哪里預(yù)測能力是最強的。分箱的方法有等寬、等頻、聚類(k-means)、卡方分箱法、單變量決策樹算法(ID3、C4.5、CART)、IV最大化分箱法、best-ks分箱法等。如果是離散變量,每個變量值都有一定的預(yù)測能力,但是考慮到可能幾個變量值有相近的預(yù)測能力,因此也需要進行分組。

????????通過對變量的分割、分組和合并轉(zhuǎn)換,分析每個變量對于結(jié)果的相關(guān)性,剔除掉預(yù)測能力較弱的變量,篩選出符合實際業(yè)務(wù)需求、具有較強預(yù)測能力的變量。檢測變量預(yù)測能力的方法有:WOE(weight of Evidence) 、IV(informationvalue)等。

????????(4)分析建模:即對于篩選出來的變量以及完成好壞定義的樣本結(jié)果。放入模型進行擬合。如評分卡一般采用常見的邏輯回歸的模型,PYTHON、SAS、R都有相關(guān)的函數(shù)實現(xiàn)模型擬合。以下是生成的評分卡的例子。

????????(5)評估及報告:即通過驗證樣本對模型的預(yù)測進行校驗。評估模型的準確性和穩(wěn)健性,并得出分析報告。常用的方法有ROC曲線、lift提升指數(shù)、KS(Kolmogorov-Smirnov)曲線、GINI系數(shù)等。

????????(6)應(yīng)用:對模型進行實際部署和應(yīng)用,如基于評分進行客戶準入和產(chǎn)生額度,并在貸款系統(tǒng)進行模型部署,自動對申請客戶進行評分。

????????(7)監(jiān)測:建立多種報表對模型的有效性、穩(wěn)定性進行監(jiān)測,如穩(wěn)定性監(jiān)控報表來比較新申請客戶與開發(fā)樣本客戶的分值分布,不良貸款分析報表來評估不同分數(shù)段的不良貸款,并且與開發(fā)時的預(yù)測進行比較,監(jiān)控客戶信貸質(zhì)量。隨著時間的推移和環(huán)境變化,評分模型的預(yù)測力會減弱,所以需要持續(xù)監(jiān)控并進行適當調(diào)整或重建。

????????在信用風險建模中,目前評分卡建模還是主要的方式,除了申請評分(A卡(Application score card))還有B卡(Behavior score card)行為評分卡、C卡(Collection score card)催收評分卡。B卡主要進行客戶貸后管理,如何進行風險預(yù)警,C卡進行催收管理,確定如何催收以及催收方式和時間點。信用風險模型中還有一個是反欺詐模型,它主要是識別假冒身份、虛假信息、批量薅羊毛等欺詐行為。隨著機器學習和大數(shù)據(jù)的發(fā)展,其它的一些建模方式如決策樹、深度神經(jīng)網(wǎng)絡(luò)也越來越多的應(yīng)用到了風險建模中。

????????信用風險模型是數(shù)據(jù)倉庫支持的重要數(shù)據(jù)應(yīng)用之一,在風險建模分析階段,數(shù)據(jù)倉庫是建模樣本數(shù)據(jù)以及衍生指標加工的主要提供者,業(yè)務(wù)人員一般在自助分析平臺進行數(shù)據(jù)分析和建模,模型建立完成并部署后,會基于數(shù)據(jù)倉庫數(shù)據(jù)進行模型效果的監(jiān)控。在貸后管理中,風險集市也會進行貸后指標的加工。另外風險模型以及預(yù)警中會經(jīng)常使用到外部數(shù)據(jù),這部分數(shù)據(jù)也是通過數(shù)據(jù)倉庫進行對接、加工和存儲。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,505評論 6 533
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,556評論 3 418
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,463評論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,009評論 1 312
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,778評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,218評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,281評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,436評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,969評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 40,795評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,993評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,537評論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,229評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,659評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,917評論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,687評論 3 392
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,990評論 2 374

推薦閱讀更多精彩內(nèi)容