當前位置:
首頁 > 最新 > 機器學習:風險管理和合規性的革命?

機器學習:風險管理和合規性的革命?

本篇將承接上篇文章,將討論三種機器學慣用例的狀態:信用風險的建模、欺詐和洗錢的檢測,以及金融機構中對行為風險和濫用行為的檢測。

信用風險和收益建模

自21世紀初以來,關於使用機器學習方法來模擬信用風險的廣泛學術文獻已經發展起來。為了給大家舉幾個例子,Angelini等人(2007)運用神經網路方法,在義大利中小企業的一個小數據集上模擬中小企業信用風險。Auria和Moro(2008)使用支持向量機對公司的償付能力進行評估,發現他們比現有技術更準確地預測出樣本外的預測。Khandani等人(2010)將廣義分類和回歸樹(CART)應用於商業銀行的大型數據集,以建立消費者信用風險模型。這些因素結合了傳統的信貸因素,如債務與收入比率,以及消費者銀行交易,這大大增加了模型的預測能力。

圖片來自網路

金融機構傳統上使用線性、logit(分對數)和probit(概率單位)回歸模型來模擬資本需求、壓力測試和內部風險管理過程的信用風險。最近,許多人開始嘗試使用機器學習方法來提高財務風險預測。非監督的方法通常用於研究數據,而回歸和分類方法(回歸樹、支持向量機)可以以預測關鍵的信用風險變數作為違約或損失的概率。銀行通常有大量的貸款級數據記錄作為輸入。

有時銀行也經歷過機器學習可能很難應用,因為方法可能是複雜的,模型對數據的過度擬合也很敏感。因此,銀行內部數據的質量並不總是適合於高級統計分析,而銀行並不總是能夠整合來自整個金融集團的數據,其中包括跨轄區的數據定義不一致和使用多個系統。非參數和非線性的方法(支持向量機、神經網路和深度學習)和集合是如此複雜,以至於它們實際上是「黑盒」,即使不是不可能,也很難從外部去理解和審計。這使得這些模型很難用於監管目的,例如基於巴塞爾內部評級方法的內部模型的開發。財務主管通常要求風險模型清晰簡單,以便可以理解和驗證,並適當地加以驗證。

然而,這並不排除使用機器學習來優化具有調節功能的參數和模型。線性和簡單的非線性機器學習方法可以被應用,並且仍然比類似的非機器學習方法更好地執行。機器學習也可以應用於選擇變數和優化現有的線性調節模型的參數。Khandani等人(2010)強調,CART(樹)模型可以很容易地生成可解釋的決策規則,儘管它們的邏輯是非線性的。事實上,已經有一些銀行在監管環境中應用機器學習的例子。在一個公開的例子中,花旗集團聘請了一個外部供應商為2015年的CCAR鍛煉建立收入預測模型。

欺詐

機器學習已經應用了十多年,取得了巨大成功的一個領域是對信用卡欺詐的檢測。銀行已經為他們的信用卡支付基礎設施配備了監控系統(所謂的工作流引擎),用於監控潛在欺詐行為的支付。欺詐交易可以實時被阻止。這些引擎使用的欺詐模型已經接受了歷史支付數據的培訓。

信用卡交易的高頻率提供了演算法訓練、回溯測試和驗證所需的大數據集。此外,由於銀行能夠明確無誤地核實哪些交易是欺詐性的,哪些不是,他們可以用相關的欺詐和非欺詐標籤來構建清晰的歷史數據,以培訓分類演算法。歷史交易數據集展示了各種預先確定的欺詐特徵,它們區分了普通的銀行卡使用和信用卡使用,包括交易、持卡人或交易歷史的特徵。

通過支付系統檢測洗錢和恐怖主義融資,與機器學習在信用卡欺詐方面的長期記錄形成了對比。許多銀行仍然依賴傳統的基於規則的系統,這些系統專註於單個事務或簡單的事務模式。這些系統通常無法檢測複雜的事務模式,也無法對支付基礎設施的事務行為進行全面的觀察。由於它們的選擇方法粗糙,這些系統所產生的假陽性數量是巨大的。因此,對警報的評估和從實際可疑的觀察中過濾假陽性結果需要大量的人力。此外,數據共享和數據使用的障礙,以及長期確立的監管要求,在反洗錢和反恐金融領域有複雜的創新。

機器學習系統有可能顯著提高對洗錢活動的檢測能力,因為它們能夠識別數據中的複雜模式,並將交易信息與網路速度相結合,並利用許多其他來源的數據獲取客戶活動的整體圖像。事實上,這些系統已經被證明會顯著地帶來假陽性。

然而,到目前為止,在反洗錢空間中的應用已經滯後了幾個原因。首先,洗錢很難定義。關於洗錢和金融機構的定義沒有普遍一致的定義,沒有得到執法機構的反饋,他們報告的可疑活動原來是洗錢。因此,使用歷史數據來訓練洗錢檢測演算法是比較困難的,因為洗錢的發生率一般不確定。作為第二好的,金融機構正在優化洗錢檢測演算法,使用較低水平的可疑活動報告作為分類的一個變數,使用分類之間的分類,銀行可以分類為錯誤警報,而那些將被提交給執法機構的是SARs。

非監督學習方法也適用於反洗錢和反恐金融,因為它們通過集群事務或客戶端活動從數據中「學習」相關模式。這就產生了額外的見解,因為洗滌方法採取各種形式並在持續的基礎上發展。

這種無監督學習的一個例子就是集群。集群需要大量的數據集,在這些數據集中,它可以自動在數據中找到模式,而不需要標籤。集群工作通過識別異常值作為點,而不需要任何一個集群組的強大成員,從而在數據的子集內發現異常。在AML中,聚類是用來將數據分組的方法之一;使用其他的分析,例如拓撲數據分析和維度減少,機器學習可以減少大量的假陽性,通常與替代方法相關。

在交易中監視行為和市場濫用

在金融機構中,機器學習日益被應用的第三個領域是對為該機構工作的交易員實施的監控行為。此類違規行為的例子包括流氓交易、基準操縱和內幕交易——這些違規行為可能導致金融機構的財務和名譽損失。在過去的幾年裡,已經開發了自動化系統,以多種方式監控交易者的行為並提高準確性。

第一代監控系統的能力僅限於監控交易行為,而僅通過評估單個交易。然而,機器學習方法的改進能力,識別大型複雜的數據模式,使得新一代的系統能夠分析整個交易組合。這些系統還能夠將交易信息與交易員的其他行為信息聯繫起來,例如電子郵件流量、日曆項、構建check in和檢查超時,甚至是電話。技術,例如自然語言處理(通常基於深度學習)和文本挖掘(可以基於幾種學習演算法),已經使這些來源機器可讀並適合自動化分析。然後將一個或多個交易員的交易行為和通信的輸出進行集成,並將其與「正常」行為的概要進行比較。當交易員的行為或交易行為偏離正常的狀態時,系統會向FI的合規團隊發出警報。

在這個空間中應用機器學習有幾個挑戰。首先,通常沒有標記數據來培訓演算法,因為金融機構在過去與開發商的違規行為中共享敏感信息是法律上的複雜行為。因此,監督學習方法很難應用。其次,監控系統需要為監管者和合規官員提供審計,並且需要能夠向合規官解釋為什麼某些行為會引發警報。對於完全基於機器學習的系統來說,由於學習方法的「黑箱」特性,這是很困難的。為了便於對合規團隊進行解釋和操作,最好將其與特定類型的行為的檢測聯繫起來,而不是僅僅基於數據上的統計相關性。

這些問題至少可以通過建立一個基於行為科學模型的學習系統來解決,該模型包含了人類的決定和行為特徵。在某種程度上,這樣的模型解決了機器學習方法缺乏解釋力的問題。來自系統的任何警報都將基於它從模型中識別出的偏差。然而,將機器學習方法包含在模型的頂部,會在系統中創建一個反饋循環,通過它可以適應不斷變化的行為,並「了解」一個交易員,因為它會獲取更多的數據。這與以往的基於規則的系統有很大的不同,後者無法調整其監視方法以改變概率分布和相關性。因此,這些系統通常基於更傳統的機器學習類型,這可以比複雜類型更容易被審計和解釋,例如神經網路和深度學習。

實現自動化監視系統的一個實際障礙是,有時在FI的IT系統中發現了碎片化和複雜性。要想了解交易者的行為,監視系統需要來自許多來源的信息,這些信息很可能在不同的系統中被發現,這些系統可能是互不兼容的,也可能是緩慢交付的。

結論

機器學習和人工智慧是當今許多領域的大課題,包括金融服務業。金融機構正在尋找更強大的分析方法,因為它們需要管理和挖掘越來越多的監管報告數據和非結構化數據,無論是出於遵從性目的,還是為了與其他金融機構和金融科技進行有效競爭。FI似乎沒有方面的商業模式,不以某種方式影響機器學習和人工智慧:它可以提高洞察客戶偏好、風險管理、檢測欺詐,和行為違反,自動化客戶端支持或允許自動身份驗證時加上生物識別技術。

本文介紹了機器學習領域,並在與IIF成員和技術供應商討論的基礎上,討論了金融機構內的幾個應用案例:信用風險建模,信用卡欺詐和洗錢的檢測,以及對金融機構的行為的監控。在金融領域,機器學習的使用有兩個初步的結論——試探性的,因為這個領域正在快速發展,許多金融機構還在一些空間中嘗試機器學習。

首先,機器學習包括一系列統計學習工具,這些工具通常能夠分析大量的數據,同時提供高粒度和深度的分析,主要用於預測目的。一些方法來推斷非線性關係並沒有做出關於變數之間關係的假設的形式進行數據分析的能力(即非參數)增加的詳細數據可以分析和結果預測。無監督的方法允許對沒有依賴變數的數據進行探索。在訓練數據和組合模型上運行數千次的演算法提高了它們的預測能力,同時限制了過度擬合和保持分析粒度。

這種改進的、經常自動化的分析功能允許金融機構在業務流程(如貸款、風險管理、客戶交互和支付)中獲得更好的洞察力。隨著這些過程中產生的數據越來越多,機器學習可以發現更豐富、更複雜的模式和關係,就像對交易或信用風險的分析一樣,或者通過連接不同的數據集來得出更準確的總體結論,就像監視行為被破壞一樣。

其次,機器學習方法在金融領域的應用與環境密切相關。大量的高質量的培訓或分析數據在金融機構中並不總是有用的。更重要的是,分析幾種方法的預測能力和粒度以增加模型複雜性和缺乏解釋性的洞察力為代價。這是個問題,特別是分析應用於監管環境的問題,而主管或合規團隊將希望審計和理解應用模型。幸運的是,更簡單的機器學習方法確實存在,將非線性分析與簡單結合起來。實際上,在金融領域,機器學習分析的供應商通常致力於將機器學習的深度與模型的簡單性結合起來,或者添加因子模型來提高產品的可審核性。看來似乎每個問題都有對應的演算法。

艾真融科創新金融科技,服務智能投顧

往期文章了解一下


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

從預處理到部署:如何使用Lore快速構建機器學習模型
谷歌發布Cloud AutoML,降低機器學習門檻將人工智慧大眾化

TAG:機器學習 |