深挖另類數據,完善知識圖譜,「熵簡科技」想建造投資者與大數據之間的橋樑
證券行業迎來數據爆炸時代,傳統的金融數據服務商積累了海量高質量的結構化數據,並按照一定邏輯分類展示給用戶。不過高質量的數據只是研究基礎,如何在這基礎之上快速給出準確的投資判斷,更多取決於金融行業研究人員腦中的投資經驗。
不過純靠人力進行數據分析效率較低,而且分析師也存在認知邊界。近幾年大數據和人工智慧技術的飛速發展,使得數據分析效率的大幅提升成為可能。成立於2017年7月的熵簡科技就是基於對結構化、非結構化數據的分析和深度挖掘,為資產管理公司提供智能投研服務。
智能投研簡單來講,就是藉助自然語義處理和機器學習,將大數據變成有利於投資者進行投資決策的小數據。熵簡科技CEO費斌傑告訴36氪,智能投研有兩大核心,分別是另類數據和知識圖譜。
另類數據(Alternative Data)意指可能影響投資決策但又不屬於市場統計範圍之內的數據,而ACTD是另類數據中的一個重要分支,全稱叫做Aggregated Consumer Transaction Data。熵簡科技通過對各大電商平台進行持續的數據監控,能夠對消費行業上市公司業績作出前瞻性預測。除了ACTD之外,費斌傑提到,通過對Github上開源項目的pull/push數據進行持續監控,熵簡科技能夠前瞻性地預判科技型公司的產品開發進度和上線日期,這對於區塊鏈、人工智慧行業的投資者來說是一個重要的基本面前瞻分析指標。
在數據源方面,熵簡科技搭建了穩定的數據採集體系,可實時監控1200+個數據源。費斌傑表示,爬蟲技術相對成熟,技術難點更多體現在大數據的存取與分析上,尤其是非結構化數據的處理。
如果說另類數據是智能投研的原料,那麼知識圖譜(Knowledge Graph)就是智能投研的大腦。所謂「知識圖譜」是將實體、屬性、關係等非結構化數據固聯起來,進而為投資決策提供邏輯支持。體現在投資行業,就是研究員可以將相關的行業、產品和公司等多方因素聯繫在一起,當觀察到某個因素髮生變化時,即可以根據關係鏈推理出觀點和預測,為投資決策提供支撐。
熵簡科技聯合創始人劉佳琪告訴36氪,完善的知識圖譜是AI在投資研究中應用的必要條件,金融行業最不缺的就是海量的高質量研究資料,通過對研報、公告等文本信息的深入挖掘,形成能夠自我生長、自我學習的知識圖譜體系,這是智能投研的重中之重。
知識圖譜作為智能投研的靈魂,很大程度上決定了產品的價值。熵簡科技現在擁有一個5人投研團隊,他們組建起了多個行業的知識圖譜,並不斷完善它們。基於另類數據和知識圖譜,熵簡科技現在可以提供數百家上市公司的追蹤和分析模塊。
除了為現有客戶提供好售前和售後服務,熵簡科技需要同時投入人力物力,開發新的知識圖譜並接入新的數據源。費斌傑表示他們正在擴招技術團隊,以保證為客戶提供高質量的智能投研服務。
智能投研的概念興起已有一段時間,市面上也有相關產品問世,但大多是根據市場熱度等指標對信息作簡單處理,對於投資者的價值較為有限,距離產品成熟化還有很長的路要走。國外的智能投研產品發展相對較快,有Palantir Metropolis、Visible Alpha、Trefis、Alphasense、Dataminr、Kensho 等。國內智能投研公司近些年也紛紛面世,如通聯數據、數庫科技、文因互聯等。
熵簡科技現已完成1000萬元的天使輪融資,投資方為清泉石資本,預計下個月即將開啟新一輪融資。公司核心成員均來自清華大學以及一線互聯網公司,合伙人團隊此前分別就職於Bloomberg以及嘉實基金等國內一線公募、私募投資機構,對智能投研有著深刻的理解。


※服務晶元廠商,「數跡科技」想要切入高速增長的機器人產業
※如何像Ray Dalio一樣做決策?
TAG:36氪 |