聊聊「基因區塊鏈」
快,關注這個公眾號,一起漲姿勢~
文/徐大梨
本文僅僅是個人的片面看法,不代表任何機構的立場。觀點不一定正確,說的不對的地方,歡迎辯駁指教。
1
各個行業領域現時流行的BP中,區塊鏈幾乎已經成為必要的關鍵字。
微博上一則吐槽的截圖
在「區塊鏈」的熱潮下,基因檢測領域也出現了各式各樣的基因區塊鏈項目,譬如鼎鼎大名的遺傳大牛George Church牽頭成立的Nebula Genomics。我對George Church還是很服氣的,他大概創立了100家公司了吧,難能可貴的是沒有一家成功,非常consistent。
國內不少基因檢測公司,包括華大基因、基雲惠康等公司都陸續出了區塊鏈白皮書。行業內一時眾說紛紜,各種觀點都有。
我很贊同浙民投楊彬師兄的觀點,區塊鏈本質上就是一個技術,它是一個基於共識機制的分散式數據存儲的計算機技術。對於任何一項技術,不要過於神話,也不要一棍子打死。要看這項技術是否有明確的應用場景,並在其中為用戶創造價值。
那麼問題來了,基因區塊鏈能幫助這個行業解決什麼問題,創造什麼價值?
各個基因區塊鏈項目白皮書上寫了很多美好願景,歸根到底想要解決的問題是兩大類:數據歸屬和隱私保護。
一、先說數據歸屬。
「從23魔方降價,聊聊「羊毛長在豬身上」一文中,我寫過消費級基因檢測機構靠資料庫業務賺錢的商業模式。基因檢測機構將大量用戶數據賣給科研機構或藥廠獲取高額回報。用戶本人很可能對此一無所知,也拿不到任何報酬。
Nebula Genomics、基雲惠康HGBC等基因區塊鏈項目,想要把個人基因數據變成類似專利一樣有版權的東西,讓用戶享有自身數據的歸屬權和版權,並從數據交易中獲益。
基因區塊鏈項目在商業模式上並不新鮮,同樣是把基因數據賣給機構獲取價值。不同之處在於,用戶能夠從自身基因數據資產中獲得商業價值。用戶作為數據的唯一所有者,直接與買方通過虛擬貨幣進行數據交易,授權使用,沒有中間商賺差價。這也算是許三觀賣血記的高科技升級版吧,所謂「財務自由,唾液可得」。
二、再說隱私安全
基因檢測領域,用戶隱私是繞不開的話題。基因數據的泄漏,可能會導致基因歧視。也許未來有一天銀行拒絕你的長期貸款申請,因為數據顯示,在你償還貸款之前,很可能患上阿爾茨海默病並死亡;同理保險公司拒絕賣你保險。
基因隱私泄漏的風險來自兩方面,一是外部黑客的盜取,二是基因檢測機構內部的濫用。
區塊鏈技術基於分散式存儲和非對稱密鑰,更能抵禦黑客入侵,適合安全存儲高敏感信息。同時區塊鏈的確權技術,方便數據授權使用和追溯,解決數據內部泄露的隱患。
2
從技術和產品的角度,聊一聊我對基因區塊鏈的一些質疑。
首先,區塊鏈最本質的特徵是「去中心化」,但是「去中心化」在基因領域是很難做到的。因為測序會不可避免地存在中心,用戶無法自己在家測序,還是要受制於測序中心的。另外目前技術水平下,數據不可能直接從測序儀寫到區塊鏈上,很大概率會先在測序中心的伺服器上保存。應用層面上數據分析也會存在中心,需要把大量樣本匯總後才能做GWAS等研究,因此數據也很可能會保留在數據分析中心的伺服器上。
這種情況下,用戶的數據並不是唯一保存在區塊鏈上的。對於區塊鏈之外的那些數據備份,依舊沒解決數據歸屬和隱私安全的問題。
這讓我想起,小時候我家小區的分類垃圾箱。垃圾箱倒是給垃圾分類了,但所有的垃圾箱里的垃圾都讓一個垃圾車倒在一起混著運走了。這不是自欺欺人嗎?
第二,基因區塊鏈在實際使用中很可能難以滿足基因數據對於傳輸帶寬和存儲的高要求。雖然基因數據的交易並不像銀行交易要求高頻次和高時效性,但是基因數據本身的數據量級會帶來技術挑戰。以一個人的WGS數據為例,測序深度為10X的數據量為30個G,測序深度為30X的數據量高達90個G。
基於區塊鏈的書畫文字的知識產權保護和基因數據的隱私保護,看似原理是一回事;但是在實際應用方面,技術難度完全不一樣。因為兩者的數據量存在天壤之別,可實現性是完全不同的。
第三,區塊鏈智能合約最大的問題是不具備容錯性。我一直覺得好的產品要有一定的容錯性。譬如我在銀行存錢,我弄丟賬號密碼,還能憑身份證掛失找回;但是我在區塊鏈上存虛擬貨幣,一旦忘記私鑰的話,找都找不回,因為壓根沒處找。同樣的道理,我的區塊鏈賬戶被黑了,就是被黑了,再也找不回來了。在區塊鏈上持有資產最大的風險真的不是虧錢,而是丟失。
區塊鏈是不支持回滾的,一旦發起交易後是無法反悔的。我當時願意把自己的基因數據授權給別人使用,但是我現在不願意了,可能也沒辦法撤回授權。
3
基因區塊鏈項目還存在一些政策和倫理的風險,這些都會給商業化的前景帶來不確定性。
最直觀的一個問題,用戶是否有權自由出賣本人的基因數據?因為這個行為會在一定程度上會泄露了其親屬的基因隱私。一個人的基因信息並不僅僅屬於本人,也會影響子孫後代。
再一個問題,科研中的醫療數據只要把姓名、身份證等信息隱去,就可以公開使用了嗎?基因檢測數據和以往的普通醫療數據不同,更為敏感,大約選取七八十個統計上獨立的SNP位點就能唯一確定一個人。當基因檢測數據與一些疾病表型數據相遇時很容易匹配到具體個人,從而侵犯個人隱私。
中國人群疾病相關的基因數據甚至還會關係國家戰略安全。我國目前還沒有十分明確的政策法規指導基因檢測數據使用,因此政策風險是客觀存在的。
好在Nebula Genomics、HGBC等基因區塊鏈項目都要求用戶先購買基因檢測的服務,定價分別為999美元和4999人民幣,顯然是要在測序上先賺一波。即便後面的區塊鏈業務全盤失敗,單靠前期做基因檢測也不會虧。
希望隨著技術進步和政策監管的完善,基因區塊鏈目前存在的問題能夠逐步解決,在未來能更好地為用戶創造價值。


TAG:徐大梨故事會 |