當前位置:
首頁 > 最新 > 新蜂觀察:社交網路分析方法在銀行業客戶分析的應用

新蜂觀察:社交網路分析方法在銀行業客戶分析的應用

在日常工作中,我們常碰到針對客群類分析項目。如資金在對公、對私客戶群間的流動問題、風險在不同群體間傳導到擔保圈問題、基於交易的產業鏈問題等。分析多基於客戶的交易行為開展。金融交易行為參與者在不斷變化的關係當中發生交互,交易流水信息則是交易交互的忠實記錄,大量的交互構成了資金交易網路。如何對網路看展分析,就顯得尤其重要。網路分析考察的是網路節點之間的結構與關係問題,這些節點可以是人、社會團體、網頁和商品等等。

隨著網路技術和智能終端的快速發展,在線社交網路成為人們日常必不可少的工具之一。在線社交網路是以人為中心的計算,用戶是社交網路的主體,以用戶相互建立的關係為基礎,以自主或非自主方式建立的關係網路。主流社交網路及垂直社交網路(如提供旅遊、購物、醫療及學術研究等網路)通過提供優質便捷的服務,吸引眾多用戶。這為用戶提供優質便捷的服務的同時,也產生海量數據,這些數據為用戶行為分析、社會學分析及社會經濟發展等提供寶貴的資源。網路的崛起,也受到了計算機科學、社會學等多學科的關注,針對網路分析,也產生了眾多分析方法。社交網路分析涵蓋社交網路中的互動行為及相互影響關係、社交網路的隱私行為和特徵、社交網路用戶的行為預測等。主要研究方向為用戶行為(用戶影響力、用戶偏好)、屬性預測及社交網路分群。

不同與社交網路中用戶主動隱藏自己的信息的行為(據研究表明,社交網路中50%的用戶選擇隱藏個人信息、70%的用戶隱藏個人愛好信息),商業銀行獲取的客戶交易行為信息多為企業真實發生資金交易,獲取的客戶信息也更全面。在對資金網路客戶分析、挖掘過程中,合理借鑒社交網路的分析方法,依據客戶在商業銀行中的個體屬性、活躍程度、交際範圍、行為特徵等要素的不同,識別客戶資金網路中的影響力,分析客戶所屬社群,採取針對性的營銷、風險防範策略,往往能取到較好的效果。

一、用戶行為研究

用戶行為可以粗略分類用戶影響力和用戶偏好兩個方面,用戶影響力和用戶偏好在社交網路演化、信息傳播及推薦系統中扮演重要角色。

1、用戶影響力分析

用戶的影響力是指用戶對周圍的人所能產生的影響及帶動作用,是用戶在社交網路中的重要性的度量指標。用戶的影響力作為用戶的重要指標,是社交網路中各種關係的基礎,用戶的影響力越大,所受到的關注程度也越高,對網路的反饋作用也就越大。對用戶的影響力進行衡量,能為網路中的用戶進行合理的排序,為社交網路的拓展應用及進一步發展提供理論基礎,同時通過社區識別技術可以優化基於用戶影響力的排序結果。

相關研究主要從用戶在整個社交網路中的影響力和社交網路中用戶相互影響能力2個方面來度量用戶的影響力,主要通過社交網路的拓撲結構度量。主要採用節點度量法和節點間關係的度量方法。在節點度量法中,節點的度在一定程度上上可以表示節點的影響力大小,他們的方向可以表示用戶影響力或者信息傳播的方向。在實際計算時,往往採用出度、入度衡量節點的重要性。節點的出度可看作該節點對他人的影響程度或活躍度,入度可看作節點的受歡迎程度。

具體度量方法包括介數中心度、緊密中心度、特徵向量中心度、kata中心度、pagerank度量(可通過中心已部署的Aster工具實現)等。

2、用戶偏好分析

用戶偏好分析可以從計算用戶與用戶之間、用戶與物品之間的相似性來考慮,皮爾森相關係數、餘弦相似度、斯皮爾曼排序相關係數等方法可以用於計算用戶間的相似性,進而對客戶偏好分析。

二、屬性預測

在社交網路圖中,節點與節點之間是以特定關係鏈接在一起的。社交網路預測本質是對社交網路鏈接的預測。社交網路鏈接預測本質是預測網路結構方面的變化,基於已知用戶屬性、網路結構、群組關係、行為軌跡等數據信息,從而預測網路中尚未產生鏈接的兩個節點之間存在或者產生某個鏈接的可能性。鏈接預測包含兩方面內容。一是空間上的鏈接預測。即鏈接在收集網路數據的時候已經存在的,但由於某種原因被遺漏,因此沒有表示在網路數據中。它可以通過分析當前網路的一個快照,利用鏈接之間的關係結構信息或概率模型來預測當前網路未被觀察到的鏈接存在的可能性。第二種是時間上的鏈接,即網路鏈接在數據收集完成出現。對第一種鏈接進行預測,可以對網路中缺失的信息進行補全,第二種鏈接,是主要解決未來一段時間預測的問題。針對鏈接預測演算法,可以分成基於節點相似度、基於概率模型和基於最大似然估計三種。

1、基於節點相似度的鏈接預測方法

基於節點屬性的鏈接預測包括分析節點自身的屬性和節點之間屬性的關係等信息,利用節點信息知識集節點相似度等方法得到節點之間隱藏的關係。

基於節點相似度演算法有共同鄰居相似度(CN演算法)、共同鄰居CN法、AA(Adamic-Adar)法、資源分配RA法等。

2、基於概率模型的鏈接預測演算法

該演算法的基本思路是建立一個含有一組可調參數的模型。然後用優化策略找到最優參數值,從而使得所有得到的模型能夠很好的重現網路的機構和關係特徵。

3、基於最大似然估計的鏈接預測演算法

該演算法比較適用於有層次結構的網路進行計算。演算法的基本假設是網路的層次結構是對網路內節點間連接的體現。這種演算法有較高的精確度,但每次預測時會產生很多個樣本網路,其計算機複雜度非常高,不能處理較大的網路。

三、社交網路分群

社交網路是一種全新的虛擬的交流形態,人們通過網路空間進行虛擬交流,並形成比較親密的關係或不同角色,即社交網路中總是一部分比較活躍的客戶充當組織者的角色,其他的用戶在相同的話題或興趣下,逐漸聚合在一起,從而形成一個自我認同的虛擬社區。同一社區內的節點與節點之間連接很緊密,而社區與社區之間的連接比較稀疏。Rheingold把虛擬社區定義為認識的人們之間分享知識、信息所形成的社團。在研究中,通常把社交網路關係轉化為圖結構,圈子或群體中的用戶作為圖的節點,用戶之間的連接過信息轉發、評論或相似的話題做圖的邊,在不同的應用場景下,通過不同的社區發現演算法,把社交網路劃分為不同的子網路。

1、社交網路分群模型

社交網路結構轉化為圖結構的描述建模,可以分為靜態和動態兩類。靜態建模和動態建模的主要區別在於動態分群(社區)發現模型考慮社交網路的時間特性,在不同時刻,其結構有可能發生變化,而靜態社區發現模型假設社交網路結構(某一時點)不發生變化。

1.1靜態分群(社區)模型

靜態社區發現主要基於某一時刻網路社區結構進行描述、分析,用圖G來描述社交網路結構,頂點表示用戶,連接或轉發、評論等行為表示邊。在此基礎上,基於圖論或數據挖掘方法,實現社交網路社區的發現或提取。其形化建模描述

在靜態社區組織的定義中,緊密、鬆散程度的測度,通常有凝聚度、分離度和模塊度。

1.2動態分群(社區)模型

真實社交網路中,網路社區結構隨時間變化有可能增加或刪減。在時間因素基礎上,由於社交網路結構隨時間不斷變化,節點之間的連接有可能增加或刪除。在不同時刻對社交網路結構進行採樣,得到一個時間序列的靜態社交網路結構的無向圖,每一個無向圖稱作動態社交網路結構在這個時刻的社交網路

2、社交網路分群(社區)演算法

社交網路分群的演算法為:圖分割法和層次聚類法兩大類。

2.1圖分割法

基於圖的分割是將網路劃分成節點數相等的子網路,使得子網內部節點連接緊密,子網後群組之間的連接數較少,然後通過不斷迭代獲得所要求的子網數目。代表性演算法有Kemighan_Lin演算法和Laplace矩陣特徵值的平分法。

2.2層次聚類法

層次聚類法分為層次分裂法和層次聚合法兩類。主要利用節點之間的相似性或連接強度,對網路中的節點進行社區劃分。層次分裂法是通過不斷重複尋找對網路圖中相似性最低的節點對之間的邊,然後進行刪減,自上往下逐步把網路中的節點進行分割,最終形成不同的社區。層次聚合法通過計算並選擇相似性最高的節點對,根據相似度從到弱連接相應的節點對,自底向上,不斷地往原始空的網路圖中添加邊,最終構成樹狀圖。依據應用需求橫切樹狀圖,獲得不同社區組織。

3、社交網路分群評價

對社區網路分群評價,常採用Newman在2004年提出的Q-Modularity指標。Q-Modularity是一個定義在[-0.5,1)區間內的指標,其演算法是對於某一種社區結構,考慮每個社區內連邊數與期待值之差。實際連邊越是高於隨機期望,說明節點越有集中在某些社區內的趨勢,即網路的模塊化結構越明顯。

Q-Modularity的具體計算公式如下:


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新蜂金融雜談 的精彩文章:

TAG:新蜂金融雜談 |