當前位置:
首頁 > 最新 > 收集罕見病資料,打破數據壟斷,這家公司有高科技也有人情味

收集罕見病資料,打破數據壟斷,這家公司有高科技也有人情味

矽谷Live /實地探訪/ 熱點探秘 / 深度探討

「處處皆數據」 ,但工業界面臨的問題在於,什麼樣的經濟模型能夠鼓勵用戶分享數據,如何為那些急需數據的機構找到數據?比如醫療機構如何高效地找到基因數據,那些手握關鍵數據的患者以如何安全可靠地分享數據?

今天小探採訪的這家矽谷創業公司 DxChain,想用區塊鏈+大數據解決上面提到的問題。具體如何解決?這還要聽 DxChain 的兩位共同創始人,Wei 和 Allan 給小探細細解釋。

你的數據是 「絕對隱私」,還是 「相對開放」?

Wei 產生合夥創辦 DxChain 的想法,和他的工作經歷分不開:創辦 DxChain 之前,Wei 在 AT&T 做區塊鏈研究,再之前在 Hortonworks 做大數據。

(左為 Wei Wang,DxChain 共同創始人、首席科學家;右為 Allan Zhang,DxChain 共同創始人)

那時 Wei 就發現,他們的很多客戶 —— 比如沃爾瑪、Sears 等零售商店 —— 有很多數據,但它們不知道如何從數據里發現有價值的信息,比如賣什麼樣的商品最賺錢、如何對不同的人推銷不同的商品等。

這就涉及到了數據的收集、清理以及計算和分析一整套流程,對於大多數企業來說,這是一筆不小的負擔。因此,建立在價格低廉的情況下提供這一整套服務的平台,毫無疑問是有前途的,而區塊鏈技術的出現,提供了一個槓桿支點。

而 DxChain 正是要用區塊鏈去建立這一整套數據收集、挖掘、分析和得出有用商業結論的平台,而這個背後的核心是區塊鏈上的存儲和計算。

Wei 告訴小探,這也是為什麼 DxChain 給自己取了這個名字:D 是英文里 「數據(Data)」 的第一個字母,x 是乘法,DxChain 把數據和區塊鏈技術結合,從而放大數據的價值

如果說發掘數據價值分為 「數據收集、清理、分析、出結論」 四步,第一步 「收集數據」 就面臨著隱私問題。

數據隱私問題在美國已經發生了嚴重的事故:從美國 Facebook上周股價大跌20%,仍然是對年初爆發出的隱私問題的反彈。

目前隱私問題的現狀是所有數據在互聯網大公司的黑盒子里,至於這些數據到底被誰用了、到底怎麼用,我們兩眼一抹黑什麼也不知道。這種感覺當然不太好,那如果我們走到另一個極端,用 「誰也不許看、誰也不知道」 的辦法保護我們的數據,行不行得通呢?

我們以美國醫療領域為例。美國醫療領域有條《醫療電子交換法案》(簡稱為 HIPAA),它很強調對每位病人醫療數據的保護。一位病人的具體情況、醫療檔案,在這條法案的保護下,只有其就診醫院和保險公司能看到,其他人誰都看不到。

保護個人醫療隱私當然十分重要,如果科研機構想利用這些數據開發新葯,就會被這 「銅牆鐵壁」 碰一鼻子灰,除非該機構得到你的、和參與這項研究每一位患者的書面允許。

而一個重要的問題是,從數據角度來說,單個患者信息並不具備價值,患者信息的彙集才有價值。有沒有一個平台,在經過患者同意後,在保護患者隱私的情況下,讓患者能夠把數據分享出去,而且這個平台能夠彙集成千上萬地患者,讓數據聚集起來,具有研究價值?

DxChain 希望利用區塊鏈的去中心化和不變性,保護用戶隱私,讓用戶能夠在知情的情況下,放心地分享自己數據的同時,能夠獲得收益,而機構通過這些平台獲得大量用戶數據而突破研究瓶頸。

區塊鏈上的數據隱私保護,業界採用了許多種做法,比如同態加密(Homomorphic encryption)、多方計算(Multi-Party Computation)等,都是通過計算去加密保護隱私,目前常見的還有 SGX,這是通過硬體去加密。

DxChain 採用的是一種更實際的解決方案——對關鍵數據信息加密,從而做到隱私保護,而這個背後是對數據強大的計算能力,「由於我們能夠做到對數據細密度的操作,數據入鏈時都是有結構的,比如數據形成一個表格,有一列是人的姓名,我們就對人名這一列關鍵信息加密,但是其他的信息公開,不是把整個文件都加密,這種叫做數據模型支持的數據加密」,Wei介紹說。

數據收集:打破數據壟斷

解決數據加密問題,就是讓分享數據的用戶沒有了「隱私」的後顧之憂,而區塊鏈很可能是一個撬動數據所有權革命的槓桿。

一個不爭的事實是,目前大部分數據都被互聯網巨頭谷歌、臉書壟斷,這些巨頭獲得用戶數據之後,用這些數據盈利,但這有著不合理之處,舉個例子就知道了:

美國的空調系統非常複雜,維修昂貴且耗時,光是預約就動輒要等十天半個月,如果消費者空調壞了,要找家居電器店、百貨商場,哪兒買的找哪兒維修,而不是像國內那樣找廠商,而且這都是要付費的。

圖自網路,版權屬於原作者

目前的做法是,空調生產商收集用戶家裡空調的溫度,提前發現有可能壞的空調,然後他們把這個信息賣給家居電器店、百貨商場等負責空調維修的機構,後者再根據這個信息給消費者有針對性、有選擇性地打電話,不少消費者就會說,「哎呀真巧!我的空調還真的有點問題!」

這個模式固然很好,但如果你仔細一想,就會覺得有點奇怪:數據是通過收集消費者信息得來的,但最後買單的還是消費者。難道消費者的信息就這麼被無償使用了嗎?

在 DxChain 的設想下,未來消費者將可以選擇把自己的信息放到鏈上。如果有第三方需要以這個信息為原材料進行分析 —— 不管是空調製造商還是氣候研究機構 —— 都可以向數據產生者(在這個例子里,即家裡裝有空調的人)有償購買。用這種方式,消費者能夠通過分享自己產生數據而獲利。

我們再說剛才提到的 DxChain 運用在醫療領域的例子。

在醫療領域,感冒、發燒這種常見病不缺信息,因此也有很多對應藥品。但對於罕見病患者就沒那麼幸運了:信息的零散和缺失給藥品研發增加了難度。由於拿不到個人信息,藥品研發機構只好和醫院、和大學簽合同、收集信息,過程曲折漫長、耽誤患者治療。

但是,如果有個平台能讓患者把自己生病的情況放在上邊,藥品研發機構就可以直接購買這個信息,患者的病被治好的希望也就多了一分,患者如果能夠通過平台售賣數據而獲益,幫助他們籌集到更多經費治病,在美國目前昂貴的醫療條件下,是非常有意義的。

DxChain 就想成為這個平台。

存儲和計算,一個都不能少

想成為這個平台,背後核心問題需要解決區塊鏈上的數據的存儲計算這兩大問題。

DxChain 是一個去中心化的大數據存儲和計算網路,是一個將區塊鏈的去中心化特性運用到存儲和計算領域的開放性公鏈。

目前區塊鏈世界裡,存儲和計算是怎麼做的呢?

先說存儲。

我們都知道,比特幣和以太坊的計算和數據存儲功能都非常有限,但區塊鏈領域發展迅速,不久後就有了 IPFS,即 「去中心化的、分散式的文件存儲系統」。

但 IPFS 是個沒有鏈的文件系統,缺乏激勵機制,也就是說大家提供信息完全看人品、看心情。 IPFS 有點像區塊鏈版的 「種子」(BitTorrent)。大家誰都想要種子,但誰都不想做種子。做種子既需要帶寬、又需要硬碟,除了得到一聲 「樓主好人一生平安」,又有什麼其他的激勵呢?

因此有人說:那就給 IPFS 加上區塊鏈,不就有了激勵機制了?Filecoin 因此誕生,但目前 Filecoin 進展比較緩慢、尚未落地。

說完存儲,再說計算。

區塊鏈項目 Dfinity 就是想解決區塊鏈的計算問題。Dfinity 是無限擴容的智能分散式雲計算系統和第三代區塊鏈,並且高度兼容以太坊現有應用,潛力很大且令人期待,但 Dfinity 沒有能夠解決數據從何而來的問題。

而 DxChain 認為存儲和計算不能分家,因此 DxChain 想結合兩者、數據為主 —— 當然,這並不是說 「把 Dfinity 和 Filecoin」 攢在一起就能解決問題那麼簡單,區塊鏈又做存儲又做計算,是一個極大的挑戰,這需要從系統底層做革新。

DxChain 認為單靠一條主鏈,很難同時滿足數據的存儲、計算和隱私需求。因此, DxChain 借鑒了閃電網路多條鏈的思路,添加了存儲鏈、計算鏈兩條側鏈,讓主鏈只負責運行智能合約,管理存儲和計算側鏈,而兩條側鏈各司其職,分別負責存儲和計算,DxChain 把這個系統架構稱做「三鏈合一」。

除此之外,DxChain借鑒了 Hadoop 的思路

過去十多年,Hadoop 解決了一個機構、公司內部的數據分散式存儲的問題,但如何在不同機構和參與者之間達成信任,從而實現分散式存儲,Hadoop 解決不了,但區塊鏈則提供了完美的解決方案。

因此,DxChain 將 Hadoop 的技術優點與區塊鏈特有的機制結合起來,解決中心環境下的分散式存儲和計算的問題,DxChain 希望能通過這種方式讓數據的處理更方便、更高效。

從技術細節的角度來看,DxChain 有三大創新之處:

計算框架下的共識機制採用了 「Verification game + Provable Data Computation(PDC)」的機制,其中Verification game保證了計算過程的可驗證性,而PDC則保證了計算結果的可驗證性;

DxChain的數據存儲的共識機制採用了「Proof of Spacetime (PoSt) + Provable Data Possession(PDP)」的機制,用此來驗證曠工連續地提供存儲;

DxChain的數據模型是建立在存儲之上的,並給數據以定義,數據也就變成了有價值的知識,數據計算也變得方便起來,另外數據模型還幫助實現基於數據模型的加密和differential-privacy的兩種隱私防護機制。

下一站:價值互聯網

DxChain 希望能夠提供一個平台:在設計上,這個平台由無數的個人電腦或者是特殊設計過的礦機連接在一起組成,這樣的設計能夠實現存儲和計算的低成本;同時,這樣的設計能夠保證海量數據不被某一個大公司所獨佔,保證價值上的公平分配。

在這個 「數據市場」 上,數據的買賣雙方可以到這裡各取所需。和傳統意義上的市場一樣,在數據市場里,不同信息也會有不同的價格,而且同樣產品(即數據)的價格也會隨著時間波動。比如,年終歲末採購季時,和購物習慣相關的數據就會價格上漲。

用 DxChain 共同創始人之一 Allan Zhang 的話來說,DxChain 的終極目標是變成一台 「數據工廠」,這個數據工廠的原材料是我們生活中產生的各種各樣的數據,DxChain 的存儲功能就是倉庫,計算功能就是加工車間,通過存儲和計算、再把這些信息放到 「鏈」 這個平台上,DxChain 把這些無序的、雜亂的數據加工提純成清晰的、有價值的信息,把現在這個既有噪音、也有信號的互聯網變成未來的價值互聯網。

價值互聯網是一個美麗新世界,但這個背後是對區塊鏈存儲和計算的攻堅,並不容易,但讓人期待。

版權屬於原作者

本文來自矽谷密探,創業家系授權發布,略經編輯修改,版權歸作者所有,內容僅代表作者獨立觀點。[ 下載創業家APP,讀懂中國最賺錢的7000種生意 ]

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 創業家 的精彩文章:

為什麼說WeWork不值200億美元?
2017-2018中國共享出行年度發展報告

TAG:創業家 |