面對信用卡欺詐,AI 能做些什麼?
老實巴交的農民林建國怎麼也想不到,他有天竟會成為別人眼中的「老賴」,被追債公司逼著還錢。
這還要從前段時間有人來村裡招工說起,他和一些村民被要求填一張包含姓名、身份證號、家庭住址等信息的表格,當時為了能快點上工掙錢,大家都沒猶豫就填了。
後來他們才知道,這就是一個陷阱,所謂的招工只是幌子,詐騙團伙要的可不是他們廉價的勞動力,而是上面所填的真實信息,通過這些信息來申請信用卡,然後刷卡透支,從而讓這些信息就變為真金白銀。
但從未跟信用卡打過交道的林建國們,卻從此進入了各大銀行的黑名單,背負債務不說,還被抹上了信用污點,連整個村子都被銀行歸為了欺詐地址。以後在申請信用卡、貸款的過程中,如果出現了這個地址,就會很麻煩。
上面這個故事改編自天雲大數據 CEO 雷濤對雷鋒網所講的一個真實案例,這其實暴露出銀行在傳統的信用審核中所遇到的難題,即銀行雖然擁有上億萬級的信息資料庫,掌握著身份、聯繫方式、設備信息和資產信息等數據,但這種識別已經無法應對日益演進的欺詐技術和模式,而雷濤帶領團隊正在做的,就是希望能用人工智慧的技術,解決這個問題。
大家在申請信用卡時,其實是把自己的數據都提交給銀行,以證明我是一個有償還能力並且守信用的人,銀行多年來會有一套自己的辨別系統。
在傳統的銀行系統里,這些資料庫更多的呈現為一種二維的結構,叫關係型資料庫。如何理解?我們先來看這樣一個例子。
老張和老王兩個人準備相互擔保進行騙貸,然後一起跑路,在銀行傳統的風控架構下,這種行為很容易被發現,因為維度很小,可以迅速的通過資料庫來查詢。
但目前真實的騙貸狀況是,老張、老王、老李、老趙、老周的企業形成了一個擔保圈,打算集體跑路,當銀行現在要做一個5度甚至是6度的查詢時,依據傳統的計算方式,已經無法解決這個問題了。
在防止信用卡欺詐方面,國內目前的風控都是 rule base(規則驅動)的,更多的是根據經驗來,抽象出系列規則,每一條規則觸發一種欺詐場景,交叉組合相應的業務邏輯來進行判斷,由此來做出風控模型。(下圖)
但目前,這種方式在效率、有效性、全面性以及成本上都面臨問題。與此同時,隨著互聯網金融的興起,非現場交易的增多,這種模型會加劇銀行風險防控的難度。
雷濤曾接觸過很多金融行業的客戶,以前,他們看一個進件(信用卡申請資料)時,會注重本身是否健康真實,即有沒有違約記錄,姓名、身份證號、電話號碼等信息是否真實,但這還是會出現問題。
比如剛剛講的案例,村民的信息確實是真的,人也沒有出現過違約記錄,還是出事了。金融業的風控發展到今天的趨勢,其實會把不同的進件連接起來看深層次的關係,看從中能否發現潛在的風險。
簡單來說,就是要在申請和進件之間建立關聯,騙子手裡的資源有限,他填的電話、地址、推薦人等信息,或多或少會在每天十幾萬個進建中重複。
我們會把不同的進件連接起來進行識別,在這個過程中增加新的維度,如果有其中一個欺詐電話號碼,和他有關係的有好幾個進件,那我就會認為它有問題。
雷濤所說的短板,其實就是現有的風控模型對於數據處理能力的不足,這次,他想借力人工智慧來解決這個問題。
人工智慧做些什麼?
對於金融業而言,在信息、數據大爆炸的今天,會面臨以下兩個問題:
數據來源多,且存儲在不同系統,缺乏數據同步機制、數據無法共享。
數據利用不充分,致使行銷、審批、風險、策略研究、催收部等業務部門系統形成信息孤島。
那主打「人工智慧」的天雲,是如何應對這些難題的?
這跟信用卡反欺詐又有何關係?
其實在金融行業,多年來積累了一定的數據,無論是人行的個人徵信數據,還是部分銀行間可以相互流通的數據。(後者的意思是,如果你建行的信用卡逾期了,再申請工行的信用卡,就會遇到麻煩)
將這些數據通過特徵表達的方式轉化到數據模型後,機器就可以藉此來表達以往很難描述的金融現象,因此特別適合處理風險、欺詐以及金融產品的營銷,這些依靠過往經驗難以準確定量的事件。
具體到信用卡申請場景,這些數據包括申請人的社交數據、聯合推廣人信息數據、申請人信息數據、單位聯繫數據等。
雷濤告訴雷鋒網,這麼做有3點好處,一是融合了信用卡申請環節的各個業務數據,解決了數據孤島的問題;其次,這個過程中會引入第三方數據,比如銀聯數據等,擴展了數據的維度;第三,通過構建申卡客戶的社交複雜網路提供客戶的社交數據,在拓展覆蓋維度的同時,以弱變數來體現強變數,並且實現了社交數據的高頻率更新,提高了數據的準確有效性。
未來的打算將 AI 賦能金融反欺詐,其實在國外早已開始,雷濤坦言,目前在銀行反欺詐方面中國與北美的差距還是很大的,矽谷的金融科技創業公司很早就將這一技術應用起來了。
比如,京東和百度同時投資的美國金融科技公司Zest Finance,便是一家明星公司。
它們利用機器的深度學習,從大量的數據中提取變數,並採用多個預測分析模型,其中就包括欺詐模型。
除了反欺詐,其在預付能力模型等方面也用來幫助用戶降低信貸成本,它的核心競爭力就是數據挖掘能力和模型開發能力。
雖然目前在保險公司或者是運營商中,都有用機器學習的演算法來做用戶流失風險預警,交叉推薦等數據挖掘的工作,但目前這在國內,卻面臨很多困境。
雷濤告訴雷鋒網,一個很大的問題是人才的不足,很多做數據科學的人,一般對編程領域較為陌生,而熟悉編程的人又不懂演算法。
天雲正在做的就是將數據科學家的演算法能力,與懂業務的編程人員相結合,目前已經通過人工智慧演算法建立現金分期響應模型,預測篩選辦理此業務的高概率客戶,在信用卡反欺詐方面,也建立可循環授信模型,對客戶行為特徵進行分類,並確立客戶對循環授信響應評分。對於一些評分高的客戶,他們可以有效推送循環貸服務,從而提高銀行利潤。
為何國際上基本成熟的業務天雲要親自再來做?在採訪中,雷濤提到「後IOE」時代。
「IOE」 其實是對IBM、Oracle、EMC的簡稱,其中 IBM 代表硬體以及整體解決方案服務商,Oracle 代表資料庫,EMC 則代表數據存儲。
隨著國內去IOE浪潮的興起,大量企業開始在X86伺服器、開源資料庫產品、分散式存儲解決方案等方面開展研究和探索,而天雲正是其中之一。
就如同雖然 Windows 操作系統雖然可以用,但我們依然要研發國產自主可控的操作系統,尤其是金融等關乎國計民生的重要領域。
而這,也是目前為何國內有很多公司紛紛投入有關資料庫的研發和應用的重要原因之一。在外企工作過多年的雷濤透露,他們目前有很多員工就是來自於IBM、Oracle、EMC等。「正是因為我們這些人見過最好的產品是什麼樣,我們才有信心把它做出來,甚至做的更好。」


※「網易星球」涉嫌以偽區塊鏈遊戲收集用戶重要隱私,疑為金融業務鋪路
※專訪 | Drive.ai王弢:3種車型準備就緒,與Lyft合作的自動駕駛打車服務即將上線 | GAIR矽谷智能駕駛峰會
TAG:雷鋒網 |