當前位置:
首頁 > 新聞 > FICO前首席科學家:風險信用模型的技術演進與未來

FICO前首席科學家:風險信用模型的技術演進與未來

FICO前首席科學家:風險信用模型的技術演進與未來

作為金融業的基石,徵信對於普惠金融發展的重要性不言而喻。而對比歷經百年的美國徵信市場,我國徵信行業遠未成熟,個人徵信牌照也遲遲未落地。它山之石,可以攻玉。每當這時,美國徵信巨頭費埃哲(FICO)公司是一個無法繞開的典型研究案例。

在近日拍拍貸舉辦的2018年智慧金融高峰論壇上,FICO原首席科學家、大數據進行風險決策領域的世界級領軍人物Joseph Milana博士進行了「風險信用模型的歷史和展望」主題分享。

風險信用模型是借貸的前提。Joseph Milana博士表示,美國過去十五年最大的一塊借貸是抵押貸款。2009年大蕭條的一部分成因就是逾期貸款比例非常高,且並不重視風險建模,「那個時候有很多風險評估原則都被大家放棄了,因此當時有大量的不良貸款產生,這就是逆向選擇,吸引貸款的都是信用不好的人。」在那之後,美國金融市場又開始重視,並建立了良好的風險評估機制。據雷鋒網了解,目前,不良貸款又回到了可以被管理的水平。

以下是演講原文,雷鋒網作了不改變原意的編輯:

FICO公司的演進史

FICO創立於1956年,當時只是一個諮詢公司,專門做運營研究。1958年,FICO發明了信用評分。在七十年代,美國國會推出了公平信用評分法案,法規要求進行貸款評估的時候必須確保信息是準確的,還有另外一個特點就是如果做出拒絕的決策,這個決策必須是可被解釋的。1974年,推出了平等信用機會法案,必須要公平,給予信貸的時候必須要根據能力評估,不能根據性別或者說種族來評估。1975年,FICO開發了第一個系統來預測現有客戶的信用風險。基於他們現在的行為,比如說使用信用卡的行為習慣,對人的信用風險做出評估。1987年FICO公司上市。他們想創建一種商業解決方案,利用神經網路或者說大腦的工作機制來幫助解決問題。

1989年,FICO推出了自己的FICO信用評分機制,一個通用型的信用評估機制的首次亮相。現在這個機制已經成為美國通用的為消費者提供貸款的評分機制。

2001年,myFico.com網站上線,消費者可以自有查詢並管理FICO分數。MyFico可以讓消費者了解信用分數的評估要素,例如信用歷史、支付歷史、新近貸款等。

2003年FACTA法案通過,強制讓消費者了解信用部門提供的信用分數,有了更強的信用透明性,讓消費者可以看到自己的信用評分。

2009年,因為FICO分的盛行,公司更名為「FICO」。目前,全球有25億信用卡受到了FICO評級的保護。

政府法規對信用模型產生巨大影響

FICO前首席科學家:風險信用模型的技術演進與未來

在這個過程中,政府法規極大地影響了使用模型的類型。比如說七十年代通過的FCRA法案要求,任何時候做的拒絕決定,必須要給出解釋。我們通過建立一種線性模型(linear model)解釋為什麼做出這樣一個負面信用的決策。

第二個法案叫做ECOA法案,禁止使用消費者一些信息,比如性別、種族以及宗教信息等。這些因素不能植入到模型中,我們可以添加的維度有郵局郵編信息。由於不要求做欺詐檢測,針對此可以用一個非線性模型(non-linear model)。

此外還有一些額外的法律要求,比如說評分必須根據年齡的變化進行變化,也就是說信貸申請人隨著年齡的變化必須要及時更新評分,我們的應對方法是保序回歸(Isotonic Regression)(雷鋒網註:保序回歸屬於回歸演算法,對一個有限的實數集合Y表示觀測響應,X集合表示未知的響應值,進行擬合找到一個最小化函數。)

那麼我們究竟是如何解釋負面評價的呢?

FICO前首席科學家:風險信用模型的技術演進與未來

人們比較關注模型是怎麼樣來解釋的。FICO剛開始設立了一個非常清楚的方法——線性模型,裡面有輸入的變數、一些相關概率值,必須要把這個函數和概率鏈接起來。建模的時候必須考慮到邏輯回歸跟概率的關係。為什麼一個人會得到不太好的分數,必須要看變數是如何產生的,什麼樣的變數或者說因素會貢獻負的變數,或者說得分比較低的變數。

首先要去掉這個尺度,因為這是一個線性的模型,在這裡不是很必要去掉尺度,但是對於要求解的神經網路來說還是非常重要的。接著減去平均值,重新評估評分。分析哪個變數給線性模型貢獻的變數是最大的,這裡面有可能兩個變數是有相互關係的,比如說有收入和成本兩個變數,那麼收入減成本就得到了消費者的利潤。如果只單一看收入或成本的話,評估結果可能就非常不全面。所以解決方案就是把所有有意義的、可以解釋的變數都放入子集中,根據子集的總量對總模型貢獻來進行排序,構建一個比較有意義的或者是可解釋的子集。這是一個關於線性模式的解釋。

FICO前首席科學家:風險信用模型的技術演進與未來

至於非線性模型,我們使用神經網路,這與線性模型有較大不同。神經網路並非依賴於線性的模型,這並非意味著隱藏節點有很多層,也可以是單層的。在其中輸出模型,必須要決定輸入量是什麼,有兩種方法來確定:

第一種就是把每個子集的變數全部設置為平均值。如果所有都是平均值,要把新的變數和平均值進行比較,這樣的子集會對總分產生一個非常大的變化,可以根據總分變化來排名,這是我們今天用得比較多的模型;

第二種方法是應用單獨的模型。每次刪除一個子集,然後構建一個單獨的模型,再根據單獨的模型進行評分,最後看在子集中,哪個變數會對模型變化量產生最大的貢獻,並進行分析。

信用模型在其他領域的應用

除了應用於信用分析,信用模型在其他領域也能發揮作用。上世紀七八十年,保險行業已經用它來分析客戶風險,有一本書《醉漢走路如何影響我們的生活》非常好地描述了風險應用。再比如,電信網路方面,怎麼樣減少風險和故障等等。以及應用於網路安全,預防黑客攻擊,必須要做一些滲透測試以及怎麼從網路當中提取信息,這些都是我們做風險建模的時候可以做非常多貢獻的地方。技術問題非常有意思,有的時候數據沒有做標籤,你不知道網路是否被入侵了,我們要做平衡,有標籤和無標籤(數據集),有監督和無監督必須要有一個平衡。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

TAG:雷鋒網 |