當前位置:
首頁 > 新聞 > 這可能是最酷的大數據創業公司!他們做出了預測分析版的「谷歌」

這可能是最酷的大數據創業公司!他們做出了預測分析版的「谷歌」

(《麻省理工科技評論》中英文版APP現已上線,年度訂閱用戶每周直播科技英語講堂,還有科技英語學習社區哦~)

公司經常會僱用數據挖掘的數據科學家來收集規劃建議,例如哪些客戶想要某些服務,或者在哪裡開設新的商店和存儲產品。然而,通過分析數據來回答這其中的一或兩個問題往往就需要數周甚至數月的時間。

現在,MIT 的 Endor 已經開發出一個預測-分析平台,使得任何人——不論技術嫻熟與否——都可以通過介面上傳未經處理的數據並輸入任何關於商業的問題。這就像在用一個在線的搜索引擎,而你能在 15 分鐘之內獲得精準的答案。

這個平台基於「社會物理學」這一學科,由 Endor 的聯合創始人,東芝媒體藝術業科學的教授 Alex「Sandy」Pentland 和前麻省理工博士後的 Yaniv Altshuler 在 MIT 的多媒體實驗室共同開發。社會物理學一門是利用數學模型和機器學習來理解和預測群體行為的學科。

圖丨 Yaniv Altshuler

這一新平台的用戶可以上傳關於用戶或者其他個體的數據,比如說手機通話記錄,信用卡購買記錄或者網路活動記錄。他們利用 Endor 的「查詢建立者」嚮導來提問,比如「我們應該在哪裡開設我們的下一個店鋪?」或者「誰更可能嘗試產品 X?」通過這些問題,平台識別數據中體現出的個體之前的行為模式,再通過社會物理模型來預測未來的行為。該平台還可以分析完全加密的數據流,允許銀行或信用卡運營商等客戶保護數據隱私。

「它就像谷歌一樣,你不需要花時間思考『我要花費時間去問谷歌這些問題嗎?』,你直接能找到答案。」Altshuler 說道。

在谷歌母公司 Alphabet 的執行董事長 Eric Schmidt 的私人風險投資公司 Innovation Endeavors 的財政支持下,啟動者們已經找到了像可口可樂,萬事達和沃爾瑪等零售和銀行公司的大牌客戶。

圖丨 Eric Schmidt

最近,Endor 為一個防禦機構分析 Twitter 數據偵查潛在的恐怖分子。根據元數據中的標識符,Endor 得到 1500 萬個數據點,其中包含 50 個被識別的 ISIS 活動家的推特賬戶的作為例子。基於此,他們要求啟動者檢測出 74 個已經被確認的、標識符在元數據中隱藏得很好的賬戶。Endor 中有人用筆記本電腦在 24 分鐘內完成了任務,發共現了 80 個「疑似」的 ISIS 賬戶,其中 45 個來自該機構命名的 74 個隱藏賬戶。誤判率也非常低(35 個賬戶),這意味著人類分析師可以專門去調查這些賬戶。

群體的共性

機器學慣用於相對靜態的複雜計算問題,如圖像識別和語音識別。例如書面和口語,幾個世紀以來都實質上都沒有什麼變化。

另一方面,人類的行為卻在不斷變化。預測人類行為意味著分析很短的時間內,也許是幾天或幾周的大量微小的信號。傳統的機器學習演算法主要依賴於構建可以長時間分析數據的模型。

「一般來說,你需要大量的數據來建立描述人類行為的準確模型,這意味著你必須依賴過去。正因為你依賴過去,你無法察覺最近發生的事情,也就無法預測人的行為,」Altshuler 說道。

整個 2000 年代初期和中期,Pentland 和 Altshuler 在人類動態實驗室發展了「社會物理學」,旨在捕捉和分析短期數據,以理解和預測群體動態。在研究中,他們發現所有大數據都包含一定的數學模式,表明社交互動如何傳播和聚合的,這些模式可以幫助預測未來的行為。

利用這些數學模式,他們構建了一個平台——即Endor 平台的核心技術——可以從數百萬個原始數據點中提取具有共性行為的「集群」,比機器學習演算法更快更準確。「大多數這樣數據模式利用其他任何技術都無法與噪音區分開」,Altshuler 說。

但這些集群代表什麼並不能馬上弄清楚,只知道它們有很強的相關性。而對數據的查詢則提供了上下文。例如,通過客戶數據,有人可能會詢問哪些客戶最有可能購買特定產品。通過關鍵字,該平台將購買該產品的客戶的行為特徵,如位置和消費習慣,與未購買該產品的客戶相匹配。這種重疊創建了可能的新客戶清單,這些客戶傾向於購買該產品。

簡而言之,上傳數據並提出正確的問題就向平台提出了一個基本的請求:這裡是一個 X 的例子,更多地找到 X。「只要你能以這種方式來表述一個問題,你就會得到一個準確的答案,」Altshuler 說。

Endor 和 Endor-ish

為了測試這個平台,研究人員早先與美國國防高級研究計劃局 (DARPA) 合作分析內亂時某些城市的移動數據,以顯示新興模式如何能夠幫助預測未來的騷亂。Altshuler 還在新加坡花了幾個月的時間分析計程車行駛數據,以預測該市的交通擁堵情況。

2014 年,Altshuler 通過他的朋友,斯坦福大學的畢業生 Doron Alter 與 Schmidt 建立了聯繫,他當時是 Innovation Endeavors 的合伙人。投資者問,這項技術是否可以被「包裝成任何人都可以使用的產品」。

那一年,在 Schmidt 的經濟支持下,連續創業者 Altshuler 和 Pentland 共同創立了 Endor,將平台轉化為商業軟體。Alter 和 Stav Grinshpon 加入了團隊,他們是技術行業的老兵,也是以色列情報部門的前任技術專家。

該公司很快通過信用卡公司的 StartPath 計劃贏得了 Mastercard 的早期合作夥伴。萬事達要求 Altshuler 回答為數據科學家保留的問題,比如哪些人不久將要出國飛行,提取貸款或者增加信用卡活動。

在從以色列特拉維夫到紐約市的單程飛行中,Altshuler 處理了 100 萬名持卡人的數十億的金融交易數據點,並準確回答了 10 個問題。傳統來講,數據科學家需要花費數周或數月的時間來整理數據,並設計機器學習模型來分別回答每個問題。

公司可能聘請自己的精通分析得員工來使用 Endor。其他人將與 Endor 代表每周進行一次簡短的會議,以確定最佳的問題措辭。「將英語翻譯成我們所說的『Endor-ish』,即我們的系統可以理解的方式,只需要大約五分鐘。」Altshuler 表示。

該公司的網頁提供了一個問題結果的例子,並與傳統的機器學習引擎進行比較。一家銀行營銷部門問:「誰在未來六個月內會獲得抵押貸款?」機器學習引擎可能會檢測到擁有銀行信用卡和高信用評分並且已結婚的 5000 名客戶,但其中許多可能是誤報。而 Endor 可以發現更多具體群體,比如,即將結婚或正在經歷離婚的夫妻群體,最近將創業公司出售給 Facebook 的創業人,或最近從當地房地產課程畢業的客戶。Endor 的結果中誤報少得多,並且挖掘出了更多的潛在客戶。

更重要的是,Altshuler 表示,Endor 並不是要取代數據科學家,它被設計成一個使他們更強大的工具。他說,數據科學家對組織的業務語義最為熟悉,可以將 Endor 納入他們的工作流程。通過突破一個「瓶頸」——數據輸入的速度比任何人得出結果的速度都快——Endor 旨在幫助數據科學家改善他們的公司。「數據科學家們明白我們將使他們成為英雄。」Altshuler 說道。

Endor 最近贏得了 Gartner 的「Cool Vendor」(卓越供應商)地位,並被世界經濟論壇(World Economic Forum)封為「技術先鋒」。隨著好評的傳播,Endor 現在正在美國積累更多客戶,同時也在歐洲和拉丁美洲迎來了第一批客戶。「這是令人興奮的時刻」,Altshuler 表示。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

神秘揭幕:波音公司正式發布革命性「無人加油戰機」,軍用無人機發展已遠超想像

TAG:DeepTech深科技 |