馬云:健康醫療大數據之囧:安全性和開放性矛盾如何破!
來源:視覺中國
為解決安全性和開放性的矛盾,「傑若創-戴爾易安信技術創新聯合實驗室」於近日在南京宣布成立,並揭牌。
作者 |全勝
來源 | 醫學界智庫
有《「健康中國2030」規劃綱要》等一系列政策加持,健康醫療大數據作為國家重要的基礎性戰略資源,其地位不可撼動,發展已進入初步利好階段。
但北京大學健康醫療大數據研究中心副主任張露霞曾表示,仍有諸多難以突破的瓶頸問題:多數地區健康醫療信息無法互聯互通;大數據規範性、可用性不高;安全、隱私相關的技術、流程和法律法規有待完善;醫療大數據和其他行業數據綜合利用度不夠,等等。
為解決安全性和開放性的矛盾,「傑若創-戴爾易安信技術創新聯合實驗室」於近日在南京宣布成立,並揭牌。
「雙方已經就數據管理、數據保護、容器化部署、混合雲等,進行多次深入討論與交流。未來,聯合實驗室將聚焦數據科學與健康醫療、生命科學交叉領域的發展前沿和技術熱點,力求在生物組學數據存儲優化技術、高性能生命科學平台研發、GPU伺服器池化技術、全息組學存儲標準制定、生物醫療混合雲技術等方面,取得實質性進展。」江蘇傑若創信息科技有限公司(以下簡稱傑若創)執行董事兼CTO劉健表示。
江蘇傑若創信息科技有限公司執行董事兼CTO劉健博士致詞。圖片由傑若創提供。
傳統IT架構,無法支撐國家級健康醫療大數據
作為國家健康醫療大數據(南京)中心(以下簡稱南京中心)的技術負責方,傑若創規劃有3大核心項目。
第一,國家健康醫療大數據(南京)中心
由國家衛生計生委主導建設,揚子國投和傑若創牽頭共建。包括存儲中心、應用中心、展示中心3部分。於2017年9月全面完成的存儲中心一期,存儲數據量達到52PB(petabyte,較高級存儲單位),配置2340 TFLOPS的超算設備,可提供達到國家4級安全要求的7×24小時服務——其存儲規模和大數據應用的複雜性,被視為「存儲科技領域的一個國際級標杆」。
目前,傑若創已完成對試點區域醫療機構醫療數據的整合收集工作;完成數據中心存儲與計算硬體的維護、管理與升級;實現對南京中心存儲與計算資源的有效配置與利用。
第二,「百萬人基因組計劃」
以基因測序行業為切入口,包含多個國家立項的隊列項目。已購置50台基因檢測設備,引進數家一流的基因測序企業入駐。
目前,南京中心是全亞洲最大的基因測序基地,年測序能力達40萬—50萬人次。在一期集群入駐用戶中,包括諾禾致源、雲健康基因、世和基因等一流的基因測序企業。
第三,智慧醫療產品,「Dr.Hwa」
該計劃將實現中醫與人工智慧結合,將最先進的量子計算、量子通信和量子測量技術融入其中。
基於上述重點業務,傑若創認為,傳統IT架構無法勝任、支撐國家健康醫療大數據中心的運維。
首先是海量數據的實時存儲。大型數據中心需要的數據存儲量級別動輒數百PB。另外,基因測序技術的發展,意味著測序儀平台產生的數據要無間斷地實時存儲——傳統架構很難做到這一點。
其次是嚴格的數據安全保護機制。2015年,美國第二大醫療保險公司Anthem遭黑客入侵,近8000萬用戶數據泄露。2017年,美國佛羅里達州HealthNow Networks公司的90多萬人醫療數據被泄露,TA們面臨著電信詐騙、金融詐騙等風險。
「對國家健康醫療大數據中心這樣一個企業級平台來說,必須保證收集到的、珍貴的原始數據能安全、完整地進行存儲。安全性不容有失。」劉健稱。
再次是快速數據傳輸和隨需應用。如,在應用端發出數據請求時,第一時間把正確數據傳輸到需要它的用戶那裡,以應對靈活調用。
傳統的IT平台在面臨海量數據存儲、保護和業務應用需求時,難以協同高效地滿足以上需求,並面臨資源耗費過大的問題。
圖片由傑若創提供。
多方合作 尋求優化解決方案
2018年以來,傑若創先後牽手IBM、戴爾易安信,就數據採集、存儲、保護等,簽訂深度合作開發方案。
比如,和IBM的合作,旨在建立一整套大數據平台和高智能計算平台,對數據的採集、存儲和分析提供有力支撐,兼顧數據安全的同時,確保數據的開放性和流動性。
「這是一套升級軟硬體存儲解決方案,能節省人力成本,並足夠靈活地支撐我們對不同業務的需求。這些都是傳統平台不可能完成的任務。」傑若創總經理管曉寅表示。
混合架構下的大數據和高智能計算平台。圖片由傑若創提供。
與戴爾易安信中國研發集團攜手成立「傑若創-戴爾易安信技術創新聯合實驗室」,希望在演算法、算力、技術上持續創新,通過深度研發積極推進專業化應用平台的發展和人工智慧技術的應用,共同推動健康醫療領域的核心技術進步、應用落地及產業發展。
「戴爾易安信在數據保護、軟體定義存儲等領域,保持著行業領先地位,希望雙方以共建聯合實驗室的契機,力爭取得技術研發與合作模式上的突破與創新,站在技術制高點,助力中國健康醫療大數據應用和健康醫療人工智慧的創新發展。」劉健說。
南京中心將覆蓋華東3億人
南京中心的整體數據中心建設目標,計劃分三期實現。目前,一期服務已趨飽和。
未來,江蘇省8000萬人的個人健康檔案和電子病歷,及全省174家三級醫院影像資料等健康醫療大數據等,都將統一存儲在南京中心。中心還將面向東部地區,數據收集至少將覆蓋華東地區3億人群。
與儲存中心同步運作的大數據應用中心,將成為眾多正在起步中的生物信息公司的「共享平台」,為其提供性價比最優的方案。同時,中心也能不斷找尋出未來發展的方向和技術創新的目標,從而更專業地為入駐用戶服務。
「我們希望突出體現這一平台對之前運營模式的變革,即運用新的技術、新的存儲底層、新的整體解決方案,實現大數據的聚集和有效應用,挖掘數據裡面的價值,從而成為行業的示範,推動整個行業的標準制定。」劉健表示。


TAG:正兒扒經的人 |