當前位置:
首頁 > 科技 > 知因智慧CEO任亮:利用AI來發現金融領域裡面的規律

知因智慧CEO任亮:利用AI來發現金融領域裡面的規律

2018年,商業創新邁進新的階段,商業創新在業務飛速發展的同時,伴隨而來的也有風口大熱背後的認知沉澱與實踐積累。7月10日36氪聯合《零售老闆內參》舉辦的2018商業新生態峰會在北京舉行。本屆峰會以「質」為主題,希望新的時代浪潮下新商業企業可以看清商業本質,最終完成新商業的革新與升級。

隨著產融結合的進一步發展,金融尤其是銀行方面風控越來越被重視。

在今日舉行的「2018年商業新生態峰會」上,知因智慧CEO任亮為我們講述了如何通過AI連接金融產業,如何利用AI來發現金融領域裡面的規律。

任亮表示,必須創造性地利用大數據和AI,幫助我們去更好的還原整個經濟世界,更好的分析經濟世界的風險和價值。

以下為任亮發言全文:

大家好,我是知因智慧的CEO任亮。很多人都說知因智慧的名字起得好,知其原因從而智慧,其實我在起這個名字的時候,真正的本意是知識基因或者叫智慧基因。我認為整個世界由兩種基因構成,一種是推動物種進化的生命基因,一種是推動人文世界與經濟世界發展的知識基因,我希望通過AI發現知識基因從而獲得智慧。我自己從事金融行業,所以我們希望立足AI,去發現金融領域裡的規律,獲得知識基因,從而建立起產業的橋樑。

中美的貿易戰已經開打了,所以下半年到明年我們會有很多企業受到影響,國家也在做七千億的定項降准,這些錢如何流向實體產業和實體經濟?我們認為最優解是通過產融知識圖譜來解決當前的問題,所以今天我來跟大家分享一下如何通過AI連接金融產業,如何通過知識圖譜去發現他們的規律。

我們先從世界盃談起,足球界里有一套非常熱門的戰術,叫Tiki-Taka,梅西在這套戰術中如魚得水。它強調隊友間的協同配合,避免單人作戰,靠隊友之間的區域跑位來創造空隙,從而贏得射門機會。

我們可以看到梅西在俱樂部踢球時,他的對手並不敢包夾他,因為周圍的隊友協同點很多,但是梅西在國家隊時,戰術施行的不那麼完善,所以他常常會陷入重圍,孤軍奮戰,於是我們可以得到一個結論:單點打不過網路,明星打不過系統

如果做一個比方的話,我們談知識圖譜,可以說是我們人工智慧領域裡面的網路,因為它本質上就是一個語義網路,通過實體和關係的聚合建立網路,這個實體就是經濟世界裡面不同的對象、人和企業。同時它也是一套系統,因為它沒有一個明確的邊界,他可以把我們所看到的各種人工智慧領域的方法和技術融合在裡面,所以它非常強大。

去年有一篇文章叫做《為什麼知識圖譜終於火了》,探索了這麼多年,大家可能發現在AI和金融這種需要高度專業知識的領域在落地的時候,知識圖譜或許是一條最佳路徑。我們來看一下整個智能技術發展的四個階段,早期是專家系統,通過人來判斷,之後是BI商業智能,一直到感知智能。今天我們談大數據,人臉識別,圖像、語音、文本等這些數據已經進入到我們的模型里,去幫助金融機構進行判斷。再往後是認知智能,也就是人工智慧建立起來的很多標籤畫像,通過識別個人,識別企業去判斷它的信用。但是我覺得更重要的是現在萬物互聯,人在互聯,經濟也在互聯,所以在一個互聯的世界裡面需要通過關係來去分析這個個體,我們不能僅用個人或者企業自己的數據分析它,而是要把它還原到網路里,用網路眼睛還原個體,於是知識圖譜就成為了一項核心技術。今天我們談產融知識圖譜,核心的要義在於要把產業世界的一個關係體系建立起來,那麼這個世界裡面最核心的實體是什麼?是企業,圍繞企業建立起企業與消費者,以及企業與員工,企業與企業之間的關係,比如投資鏈、擔保鏈、貿易鏈、供應鏈,通過這個企業建立起它跟上下游、行業、地域的關係,這三個層次的關係綜合在一起叫做產業,通過大數據描述這個產業的實體和他們連接的類型,通過機器學習去提煉,這些實體和關係之間的規律和規則,所以我們把這三者融合在一起叫做產融知識圖譜。

我們舉幾個例子來看一下產融知識圖譜的表現形態,其實都是我們日常生活中間最容易理解的這些,比如說客戶、控制關係、擔保關係、資金關係等等,這些都是我們在股權方面的具體表現,包括供應鏈裡面的上游、中游、下游原料商、批發商、生產商,這些不同的實體中間有不同的經濟往來,這就是關係,這就是一個典型的知識圖譜的例子。

更大範圍的是產業鏈,一個產業通過他的上游和下游會建立起他們之間的經濟依存關係,不管是新能源汽車還是房地產,它的原料和上下游,都是我們收集數據來構建網路的目標和對象,在金融行業不管你分析的是to C還是to B都是產業里的一個環節,都是一個實體。

現在一個難點是小微,小微獲取成本非常高,而且風險非常大,怎麼辦?我們把小微企業聚集起來變成一個商圈,變成一個專業市場,這樣獲取對象會更容易獲取一些數據,這些手段都是方便我們把原來孤立的個體放在網路里,更好的分析它。比如押品估值,房產本身價格在波動,而且價格變動是很多要素決定的,比如他周邊的人口,經濟變化,城市發展的策略等等。所以通過這些要素能去預測它的房價,房價的變動會影響我們金融裡面的抵押品價值波動,這個會影響客戶的信用,會影響用戶所在群體的價值。我們從整個鏈條裡面可以看到,這個經濟世界是互聯的,我們的大數據和AI就是要試圖建立起這樣一個網路,幫我們更好的還原整個經濟世界,去分析他的風險和價值。

在產融知識圖譜的框架之下,我們必須要創造性的利用AI技術,幫助我們去真正理解他們的規律,這些技術我們稍微總結一下,其實涵蓋了整個產融圖譜構建的全過程,包括了大數據和AI演算法。

比如我們需要有領域知識的輸入,因為我們做金融,金融一定有很多的領域知識,我們在判斷一個企業和個人的時候,需要一個體系來判斷,這些都是領域知識圖譜。通過圖計算,相關的各種演算法去總結網路裡面它們的特徵。圖譜構建完以後需要大數據來填補他們的關係去進行量化,除了我們最容易理解的結構化數據,BI技術之外,現在更重要的是需要把非結構化的數據也融合進來,前面有好幾位嘉賓談到了圖像識別,這是非結構化數據的渠道,還有很多文本,特別像我們知因智慧著重在語義識別和文本識別上面,把非結構化的數據結構化,從而進入到模型里,量化之後我們去做預測。過去我們一直用概率統計模型,現在這個條件下僅用概率不夠,我們需要做大範圍的推理,需要去做量化和預測,然後把它運用到金融場景,去做金融事件的提煉,風險特徵的發現,去做傳導等等。

接下來我們來看,在剛才提到的體系下,金融場景是怎麼影射的?其實我們最早的金融評估就是打分卡,對應的是我們的專家系統,後來引入西方的巴塞爾協議做內部評級法,這個就是我們的BI商用制度,現在通過萬物互聯和知識圖譜獲得模型,對應的就是認知時代,所以金融和AI高度相關。

縱觀這段發展歷程,金融方面我們其實一直在學習西方,同時也落後於西方,但是從產業知識圖譜這個角度來看,中國反倒走在前列,為什麼呢?因為我們有自己的現實問題,也有自己的獨特條件,我們面對的現實問題是中國的企業關係網路高度複雜,而且風險頻發,比如說十年前德隆系風險事件發生後造成了連鎖性風險蔓延,所以這是我們面對的問題。另外我們中國的數據又比較集中,因為我們有強勢的政府和監管,政府會收集大量的跨領域的數據,這為我們建模型創造了條件。其實我們早在十年前,2006年的時候就已經通過監管的牽頭和驅動,在從事相關領域的研發和推進,當時我也非常有幸參與了整個過程。從風險集團事件的發現演進到2009年我們把這套體系和模型推廣到商業銀行的機構,開始做商業化的實踐,並且在學術上我們第一次提出了一套基於關係網路和行為角度去建模的方法,而不再局限於傳統的基於財物報表和評價的方法來去預測風險。

2009年再往後,我本人在中科院一直從事相關演算法方面的研究,後來去IBM做金融大數據方面的探索,一直到2016正式創立知因智慧,我們數據產業的成熟,我們金融客戶需求的爆發也推動我們做了很多標杆性金融事件,這些事件代表了我們產融知識圖譜的方向,它所能解決的問題,的確可以跳脫傳統的限制,在風險管理,精準商機的發現上取得更好的效果。

接下來我們看一下金融場景該如何應用產融知識圖譜,在這個體系之下,最底層是3K平台,KW、KE、KG,這是知識圖譜的三個核心組建。KE解決的是知識的進化過程,是包含AI演算法的建模平台;KG是知識可視化平台;KW是核心的知識倉儲,我們一直在採集大數據,但這些數據如何能夠變成我們場景所需要的核心體系,在這裡面我們叫知識倉儲。舉一個例子,比如說這裡有實體庫、關係庫、標籤庫、事件庫、語料庫等等。我們以前識別一個人或者企業的時候需要分析它的ID,但如果沒有ID該怎麼辦,怎麼判斷它是同一個企業?比如說IBM,IBM是一個簡稱,2016年大裁員是一個風險事件,而我們銀行記錄的是國際商業技術有限公司,這是一個全稱,這兩個詞不匹配就不能納入模型變數里,實體庫就是解決這個問題。很多這樣的內容我們把它打包在一起叫做知識倉儲,通過這些支撐來建立客戶譜系,我們把原來那些孤立的個體變成一個網路,包括產業譜系,客戶譜系還有它的畫像以及事件,原來我們看風險輿情,是客戶經理自己去辨別,現在我們用機器能夠讀懂輿情,能夠把輿情納入到風險變數里,整個體系我們稱之為AI盒子,通過AI盒子我們把這些工作整合在一起,賦能給公司金融、小微金融、風險管理、大資管、大零售等具體場景。

接下來我們通過一個個組件來理解一下整個產融知識圖譜的實現過程。比如說譜系,譜系是圖譜中的核心組件,通過它我們可以描繪它的股權關係,也可以描繪它的產業關係,這樣我們才能完成把個體還原到網路里的第一個步驟。接下來我們要去計算它們的傳導,他們的影響,在這個網路裡面當一個點發生問題的時候,它對關聯的點和其他的點都有什麼樣的影響,那麼我們必須要去收集金融事件,並量化事件,必須要測算出傳導路徑,這就是我們的作用。譜系+事件這是我們整個K+盒子裡面的核心內容。

舉一些實例,一家股份制銀行,通過圖譜他能夠建立企業客戶的商機,精準商機的發現、准入和風險傳達。那麼通過小微金融,原來的數據獲取可能只是一些片段零散的數據,我們通過譜系,通過小微個體經營行為的數據融合,我們去進行整個線上評估體系的建立。另一個例子,我們為一家電商金融企業做供應鏈預測,供應鏈里供貨商未來增長的變化,它未來增長的精準預測。同樣我們也需要構建一個知識圖譜,把供貨商跟他的產品還有消費人群這三者建立起關聯,消費群體的變化和商品結構的變化一定會影響供貨商以及其未來銷量。

風險管理,原來我們都在基於每一個個體收集數據預測,現在我們把他在的網路建立起來,在網路里當一個節點發生風險的時候,我們把他所影響的範圍測算出來,這裡的核心在於我們連接權重參數的訓練。所以當整個供應鏈,產業鏈建立起來後,我們就知道上游的一個風險發生後會對下游造成什麼樣的蔓延和衝擊。

包括資管,這裡面PE、VC產業鏈,通過特殊實體的構建,我們能夠找出來一批發展非常快速而且也非常活躍的PE企業,從而為金融機構提供聯動或者定製化的金融產品。整個體系裡面包括一些核心技術,在這裡面可以大家做一個羅列。剛才談到的這些場景,在國內的一些標杆型金融機構,包括國有銀行,股份制銀行,金控,互金,都得到過驗證。

最後一點,我們把剛才提到的內容變成了一個一體化的K-BOX,這個BOX把我們的演算法、數據、雲計算,融合成了知識圖譜,去輸送給金融機構,為它賦能,為它解決行業裡面的痛點和問題。

以上謝謝各位!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 36氪 的精彩文章:

火箭少女代言麥當勞,男團女團的第一個廣告為什麼總是獻給快餐品牌
要做「反 Facebook」的下一代社交網路,MeWe 近日獲得 520 萬美元投資

TAG:36氪 |