商業欺詐檢測難識別？Arcade Analytics全覆蓋！

科技 03-27

全文共3120字，預計學習時長6分鐘

欺詐檢測，指的是識別企業內實際或預期欺詐的過程。

電話公司、保險公司、銀行和電子商務平台是使用大量數據分析技術來防止欺詐的行業例子。

在這種情況下，對於每個企業來說，都面臨著巨大的挑戰：善於檢測已知類型的傳統欺詐，通過搜索眾所周知的模式，以及善於發現新的模式和欺詐。

我們通常可以根據以下方面對欺詐檢測進行分類：

· 主動和靈活的

· 手動和自動化的

為什麼欺詐檢測很重要？

根據普華永道2018年發布的一個經濟犯罪調查顯示，欺詐涉及數十億美元的業務，並且每年都在增加：在他們調查的7,200家公司中，有一半（49％）經歷過某種形式的欺詐。

大多數欺詐涉及手機、納稅申報、保險索賠、信用卡、供應鏈、零售網路和購買依賴。

投資欺詐檢測可以帶來以下好處：

· 及時對欺詐活動做出反應

· 減少欺詐活動的風險

· 減少欺詐造成的經濟損失

· 認識易受欺詐影響的弱勢賬戶

· 增加企業股東的信任和信心

一個高明的欺詐者可以破解基本的欺詐檢測技術，因此，開發新的檢測策略對任何企業都非常重要。欺詐檢測必須被視為一個複雜且不斷發展的過程。

階段和技術

欺詐檢測過程以高級數據概述開始，目的是發現數據集內的一些異常和可疑行為，例如，我們可能會有興趣尋找奇怪的購買信用卡的行為。一旦我們發現了異常，必須認識到它們的起源，因為它們中的每一個都可能是由於欺詐引起的，也有可能是由於數據集中的錯誤或只是缺失數據。

這個基本步驟稱為數據驗證，它包括錯誤檢測，錯誤的數據糾正，以及缺少數據填充。

清理完數據後，可以開始真正的數據分析階段。分析完成後，必須驗證，發布報告和將所有結果以圖形的形式展示出來。

總結一下，檢測過程的主要步驟如下：

· 數據採集

· 數據準備

· 數據分析

· 報告和結果陳述

ArcadeAnalytics非常適合這種情況，因為它是一個工具，允許創建具有吸引力而有效的報告，通過在複雜儀錶板中的不同小部件之間劃分數據，以非常簡單的方式共享特定分析的結果。

主要小部件是Graph Widget。它允許用戶直觀地查看其數據集中的連接並找到有意義的關係。此外，可以連接同一儀錶板中存在的所有小部件，以使它們彼此交互。通過這種方式，我們將能夠在結果儀錶板中看到圖形、數據表和傳統圖表小部件之間的雙向交互。

它將根據對應的主要小部件的部分數據集計算圖表分布，使最終報告動態和交互。

但這並不是全部，Arcade對於數據分析過程中的幾種技術非常有用。

數據分析通常依賴於利用統計方法和人工智慧技術的自動化過程，這些技術通常被分類為監督和非監督技術。

在統計方法中，我們可以使用：

· 數據處理

· 統計參數計算，與特定領域相關

· 模型和概率分布

· 時間序列分析

· 實體的聚類和分類，以便在數據之間找到關聯和模式

Arcade提供了多種工具來執行單系列和多系列分析，利用高效的全文搜索引擎和反向索引，確保在計算整個數據源的統計參數和分布時具有良好的性能。

信用卡分布

全球交易/訂單分布

此方法可用於識別統計分類和推斷規則：這些規則可用於定義基於規則的分類器，使用If（滿足特定條件）和Then（適當類別）規則的監督學習演算法。

此外，Arcade為時間序列分析提供了很好的支持：通過使用時間軸功能，你可以以圖形的形式查看數據以及它隨時間的變化情況。

通過這種方式，我們可以通過利用時間過濾窗口來分析特定項目或實體之間的關係何時出現，從而將時間分析縮小到特定和可定製的範圍。

然後，你可以通過放大和縮小來與此分析進行交互：通過更改粒度，可以從更寬的視圖開始執行簡單的時間自上而下的分析，這有助於第一眼看到事件如何隨時間分布。

顯然，在每個視角中，你都可以隨時間來回移動。

除了統計方法之外，它可能有助於放在自動化流程旁邊，例如：

· 數據挖掘。

· 模式識別。

· 機器學習和預測，以實施主動規則。

實際上，這些無監督的方法不需要欺詐性交易的樣本，因此，在所有沒有事先知道交易類別的情況下或者當我們想要擴展這些類別以識別以前未被發現的欺詐時，他們會變得有用。

人機交互的重要性

通常在這種情況下，我們可以遇到欺詐分析的概念，通常將其視為自動分析技術和分析技術與人機交互的組合。事實上，我們無法擺脫領域專家與用戶的互動主要有兩個原因：

· 大量誤報：實際上並非所有被檢測為欺詐行為的交易都是欺詐行為。通常，基於最佳演算法的檢測系統導致過多的誤報，即使它們能夠識別實際欺詐交易的高百分比（高達約99％）。因此，必須驗證所有結果，以便從第一個結果中排除誤報。

· 由於演算法的複雜性而導致計算時間過長，特別是在預測場景中：當演算法執行時間由於複雜性而呈指數級時，單片執行不是一種好方法，因為它可能需要大量時間來進行大輸入。因此，採用漸進方法，包括通過將特定解析度模型和自動計算與人類交互相結合來減少所請求的計算時間。在計算期間向系統設計者提出中間結果，然後他們決定分析必須以漸進方式進行。通過這種方式，可以省略整個執行分支，從而在性能方面實現了良好的增益。

對於這兩個目標，需要一個可視化工具。由於已經顯示的功能和圖表模型的表現力，Arcade Analytics非常適合這些任務。

圖表視角如何提供幫助

圖表透視圖在欺詐檢測用例中非常有用，因為正如我們已經說過的，大多數計算都依賴於模式識別。然後我們可以使用這些模式來查找和檢索我們正在尋找的所有異常行為，而無需編寫複雜的連接查詢。Arcade基於以下方面提供對不同圖形查詢語言的支持：

· 模式匹配方法：Arcade完全支持Neo4j提出的Cypher查詢語言和OrientDBSQL查詢語言的MATCH語句。當我們需要依賴多種模式來檢測欺詐時，這是一種很好的方法。

· 圖遍歷方法：使得探索圖表和任何實際感興趣的信息變得非常簡單。Gremlin是這類語言的一個很好的例子。

此外，Arcade Analytics最具吸引力的功能之一是它允許用戶從關係資料庫中查詢數據，以便在其中輕鬆地將數據可視化為圖形並探索其中的連接，無需任何遷移，只需幾個簡單的步驟。

現在，讓我們來看一個被認為是傳統欺詐檢測系統經常忽略的潛在欺詐活動的非常常見的模式，以及Arcade Analytics以何種方式幫助我們分析與該特定模式匹配的所有實例。

第一方欺詐檢測

「第一方欺詐是指個人或團體通過開設無意還款賬戶而在自己賬戶上實施的欺詐行為。第一方欺詐申請人使用合成身份證明，或者他們通常通過在申請表上向債權人撒謊或使用虛假或代理地址來歪曲其真實身份。第一方欺詐與第三方欺詐或身份欺詐不同，因為在第三方欺詐中，欺詐行為人使用另一人的識別信息。第一方欺詐包括預付款欺詐、破產欺詐、友善欺詐、應用程序欺詐和睡眠欺詐。」

在過去幾年中，基於身份盜用的第三方欺詐數量正在減少，而虛假身份和虛假個人信息的案例正在增加。

我們可以假設許多不同的場景可以被歸類為第一方欺詐檢測，從最簡單的到最複雜的。

以下可以是一個簡單的例子：

約翰史密斯開設了一個新的信用卡賬戶，將其信用額度最大化，默認值，然後消失得無影無蹤。在這種情況下，史密斯使用自己的憑證，在他的聯繫數據中有微小的變化，故意欺騙信用卡公司。

但我們也可能遇到一個由兩個或兩個以上組成欺詐團的人組成的團體，其中有一些合法的聯繫信息，如電話號碼和地址。

這些數據被合併以創建幾個合成身份，環成員將使用這些身份來打開欺詐帳戶。因此，這個新賬戶可以使用信用額度、信用卡、透支保護、個人貸款等。

這些賬戶通常用於定期購買和及時付款，因此，由於觀察到的，負責任的信用行為，銀行會隨著時間的推移增加循環信貸額度。

有一天，賬戶協調他們的活動，將其所有的信用額度最大化並消失。

然後，可以將此環模式檢測為可疑行為，並且如果及時識別和驗證，則可以避免重大損失。

以下是Arcade中匹配此環形圖案的示例圖形實例：