當前位置:
首頁 > 新聞 > 徵信大數據90%是垃圾,真正有用的數據從哪裡來?

徵信大數據90%是垃圾,真正有用的數據從哪裡來?

入夏以來,互聯網金融的天空是天雷滾滾。特別是7月份,10天100多家平台出事,引起公眾高度關注。

從之前的野蠻生長,到後來嚴監管下的跑路潮,再到如今的兩極分化,互聯網金融發展格局正在經歷一個從超額利潤到價格戰再到健康發展的過程。與之對應,放貸機構之間的競爭也可以分為三個階段:第一階段拼的是資金成本;第二階段拼的是運營成本;第三階段拼的是風險成本。而拐點的關鍵,就是徵信基礎。

徵信大數據:90%是垃圾

如果把中國互聯網金融的發展列一個時間表,大致可以分為三個階段:

2006-2011年,可以看做是信貸資產拓荒期:件均放款3-5萬,目標人群是白領與企業主,主要通過線下獲客,現金放款。

2011-2013年,稱得上是信貸資產的爆發期:授信金額兩極化發展,人群拓展至學生、藍領,線上獲客變得越來越重要。

2013年之後,信貸資產開始場景化:阿里、京東、鏈家等場景巨頭加入。

與此對應,徵信需求和解決方案也發生了很大的變化。在信貸資產拓荒期,風控最關注的是負債率,對於固定目標客戶群體,根據銀行流水判斷收入,根據央行徵信判斷負債。徵信的主要工具就是零散QQ群,參與者都是基層從業者,效率低。

在信貸資產的爆發期,風控開始關注穩定性,關注借款用途,尤其是多重負債。徵信的主要工具是系統化中央資料庫,參與主體是P2P公司,效率有所提高。

從國內大數據徵信行業的發展現狀來看,組合式的信用評估是大勢所趨。眾所周知,國內徵信體系不完善,互聯網金融行業尚未接入央行徵信系統。在此背景下,業內平台獲取原始數據通常有三種方式:內生數據、通過第三方購買和數據交換。

值得注意的是,儘管很多企業經常會吹噓自己擁有多少TB,甚至是PB的數據量,實際上它們擁有的90%是劣質數據。

有一位風險投資人這樣抱怨:

「在數據的海洋中,大部分企業都沒有花時間去思考它們應該收集什麼數據,還有採用怎樣的方式來收集數據。而是習慣於一網打盡,結果它們收集到的是一堆沒有任何預先計劃和結構條理的垃圾。」

百行徵信一家獨大

從1980年代末至今,徵信行業先後經歷了起步、搭建徵信平台、央行主導統籌等數個階段。

2015年1月5日,人民銀行印發《關於做好個人徵信業務準備工作的通知》,要求芝麻信用,騰訊徵信等八家機構做好個人徵信業務的準備工作,擇時發放第一批牌照,但一直不見下文。

最終等來的卻是由中國互聯網金融協會與芝麻信用、騰訊徵信等把家徵信機構聯手成立的百行徵信。這意味著徵信這個金融業最關鍵的閥門,最終還是要由政府來監督把控。

今年6月28日,百行徵信與蘇寧消費金融等15家互聯網金融機構和消費金融機構在深圳舉行了信用信息共享合作簽約儀式。根據合作協議,這15家機構將成為百行徵信首批接入代表機構,向百行徵信系統全面、準確、及時地報送徵信信息。百行徵信將對信用信息進行採集、整理、保存和加工,並向接入機構提供信用信息的查詢及相關增值服務。

截止目前,百行徵信已與120餘家互聯網金融機構和消費金融機構達成了信用信息合作共享協議,與50餘家機構達成了合作意向。

業內人士擔憂的是,徵信公司的核心競爭力在於擁有自己獨有的信息。作為直接競爭對手,徵信公司之間不可能用自己的核心數據去提升競爭對手的競爭力。可以說,一方面徵信公司致力於解決信息不對稱,另一方面徵信公司也在構建數據壁壘。這種信息孤島,短期內無法完全消失。

「各家徵信公司都採取中央資料庫的方式,大家上傳數據,需要時再查詢。但並非所有人願意上傳數據,操作起來也比較麻煩。」

更現實的問題在於:

信息共享的邊界如何界定?在進行數據採集時,如何兼顧數據的質量及採集範圍,避免侵犯用戶隱私?共享信息的標準有待明確。

小公司很難有機會

在一位互金領域的風險投資人看來,中國徵信市場結構是以公辦徵信機構為主,市場機構為輔,央行徵信中心壟斷大部分市場,留給市場機構的空間很小。

傳統徵信產業鏈由數據公司、徵信公司及徵信使用方三者構成。這其中,數據公司的核心競爭力在於對獨特數據源的掌控和挖掘能力,而徵信公司的核心競爭力則在於數據源完整度,數據覆蓋人群完整性以及數據的分析畫像能力。

互聯網對於徵信產業的改變,只是增加了數據公司的數據源,或提升了獲取數據的效率,但這兩點對於徵信公司而言,無法重構徵信公司核心的數據清洗、挖掘及畫像的核心環節。對於徵信使用方而言,互聯網的出現,則有可能增加了自身直接採集數據能力及風控的能力,降低對前兩者的需求。

「中國大數據徵信和風控市場,市場化空間僅數百億,即使年均增長20%以上,也需要十幾年才達市場千億的規模。」

牌照徵信公司依託牌照賦予的融資能力及數據源權利做大,但做大的空間取決於央行徵信中心的開放程度,而初創純數據徵信公司沒有做大的空間。

如果央行不將數據與牌照公司共享,後者將無法低成本獲得最核心的全銀行信貸數據,只能從央行購買,且無法在短時間內推出比央行徵信中心更有效的徵信產品,只能做輔助作用。

未來徵信行業將面臨數據同質化、產品同質化的問題,價格戰無法避免,互聯網免費的思路甚至還會降低行業整體產值。

沒有徵信牌照,徵信創業公司無法合法的去獲取核心數據,比如銀行信貸數據或者運營商,公安局的隱私數據;也無法以牌照去融資收購其他徵信公司,資金上毫無優勢。因而,業內人士認為,初創公司很難在徵信領域發展壯大,成為未來的寡頭之一。

徵信業界最經典的成功的例子就是美國的FICO。美國FICO評分主要應用了五個方面的外部的大數據:還款歷時、未償債務、信貸歷時長度、對新信貸的追求及其信貸組合。它對於這五個維度的外部的大數據進行建模,構建FICO評分,現在FICO評分覆蓋了美國99%的各種各樣的個人信貸的決策記錄。

在上述投資人看來,中國不會出現像FICO那樣獨立的風控模型公司,原因有幾點:

首先,現今國內各大銀行使用的風控模型基本屬於一次性買斷或自建模型團隊,現行市場並沒有空間給獨立風控模型公司做大。

其次,傳統FICO模型不能滿足在互聯網時代多緯度數據建模的需要。

最後,細分領域風控模型的專業化,隨著信貸行業的細分化及專業化,通用模型已無法滿足風控需求。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 金評媒 的精彩文章:

郭樹清提醒非法集資陷阱 收益率10%以上要準備損失全部本金
銀行同業強勢去杠杠:同業與負債兩頭縮 各掉1.9萬億

TAG:金評媒 |