張路霞:健康醫療大數據應用需要「好問題」
導讀
好的醫療大數據應用一定是問題驅動的,而非方法學驅動;應該尋求因果關係,而非相關性。而好問題的提出,必須靠健康醫療專業人員。
北京大學健康醫療大數據研究中心常務副主任 張路霞教授
在4月下旬舉行的「醫療大數據服務能力建設研討會」上,北京大學健康醫療大數據研究中心常務副主任張路霞教授介紹了我國健康醫療大數據發展的現狀,並從臨床醫生的角度,指出了目前大數據臨床研究所遇到的問題。同時,作為一名腎內科臨床研究專家,她還結合目前國家健康醫療大數據發展的背景,分享了其團隊在腎臟疾病人群領域大數據研究的工作進展。以下為張路霞教授演講實錄,有摘編。
「好問題」缺位制約健康醫療大數據價值的發現
經常有專家在交流一個問題:數據大到多少才算大?但實際上,在大數據的傳統概念里,數據大小只是其中一個特徵,甚至不是最重要的特徵。健康醫療大數據與其他領域大數據不同的一個維度是它的多樣性。
我國健康醫療大數據來源很多,不只是醫院應用,還包括政府行業監管數據,醫療保險數據,公共衛生服務數據,電子醫療檔案(EMR)或電子健康檔案(EHR),登記系統(疾病、操作、器械),臨床研究(包括多組學數據)、移動醫療和可穿戴設備等。
從公共衛生或醫療研究者的角度看,健康醫療大數據的來源可以更為「開放」,不局限於醫療,因為疾病和健康狀況與非常複雜的社會環境因素密切相關。在國外的應用,已經將社交媒體、環境、職業和行為習慣等數據與醫療數據開展關聯分析,從而對疾病監控、發病趨勢做出預測。
我國醫療信息化的快速發展,為健康醫療大數據應用奠定了基礎。醫療信息化解決了數據的產生、存儲和傳輸問題。但也存在數據的可用性、可及性、可整合性差等明顯不足,特別是醫療機構普遍缺乏數據整合的驅動力。在此過程中,數據科學等重要性日漸彰顯,因為數據本身要產生價值,必須經過數據科學家對數據的處理和分析後,才能產生信息知識或智慧。譬如,機器學習、深度學習或增強學習都是數據科學的方法,是實現數據應用的重要途徑。
在全球健康醫療大數據蓬勃發展的大背景下,我國相繼出台多個政策鼓勵健康醫療大數據發展,先後兩批成立國家級健康醫療大數據中心,加快推動步伐。不過,從現有用戶方的角度來看,我國健康醫療大數據應用和研究總體依然滯後於國際同行。
這可能存在兩個方面的原因:一是業內過多關注數據本身,對於數據能夠產生的價值則關注不夠;二是缺乏有效的合作機制,亟需健康醫療研究人員與數據科學家的深度融合。有價值的醫療大數據應用,一定是問題驅動的,而非方法學驅動。什麼是健康醫療最亟需迫切解決的問題?是關於業務領域「好問題」的提出。這必須靠健康醫療專業人員,遺憾的是臨床醫生實在太忙了。如果合作機制問題不解決,不利於醫療大數據分析研究的產出。
在腎臟疾病領域的嘗試
尿毒症是腎臟疾病最嚴重的一種,目前在全球範圍內公認的一個事實:糖尿病是尿毒症的首位病因,大概佔到1/3。但在我國腎臟病領域一直公認的卻是:半數尿毒症病人是由腎炎導致的,糖尿病佔比不足20%。實際上,我國糖尿病的發病率攀升得非常快,1980年是1%,但在最近幾次全國性糖尿病調查中,長期患病率大概在11%左右,我國已是世界第一的糖尿病大國。那麼,糖尿病會不會對腎臟病疾病造成影響呢?目前我國缺乏腎臟疾病大人群的研究和全國性的監測體系,現有的數據和研究多集中在各種腎炎與尿毒症上。
2010年,我與老師王海燕教授在《中華內科雜誌》上發表了一篇述評,來專題探討糖尿病對於腎臟疾病的影響。當時我們只是有這個想法,但很難用傳統的臨床研究方法實現全國範圍內的問題研究。2014年,在世界衛生組織-國家衛計委雙年項目的支持下,利用兩個全國性人群數據開展了相關研究。一個是一般人群,在「十一五」課題支撐下,對2009年全國一般人群CKD(慢性腎臟病)的調查,應用多階段分層抽樣抽取全國成年人群代表性樣本,樣本量為4.7萬。另一個是原國家衛計委的全國住院人群病案首頁的資料庫,包括2010-2015年全國三級醫院住院人群的3500萬名研究參與者。
(圖中淺灰色線為糖尿病腎病在腎炎中所佔比例,深灰色線為腎炎在慢性腎臟病中所佔比例;N Engl J Med. 2016;375:905-6)
圖表顯示,在2011年,中國腎臟病疾病譜發生了一個交叉,糖尿病腎病首次超過了腎炎引起的腎臟病,且隨時間的延續,趨勢愈加明顯。該研究成果於2016年9月發表在《新英格蘭醫學雜誌》上;同時該研究成果最後還生成了政策建議,上報原國家衛計委和世界衛生組織。
研究結果證明,中國腎臟內科的學科建設應該向「高危」糖尿病腎病傾斜。以往給北京大學醫學部八年制學生講腎臟病課程時,由於當時對腎臟疾病的認知,60%的課時用來講各種腎炎,不涉及糖尿病腎病。這種教育模式顯然已經不契合疾病的變化趨勢,大量的臨床培訓、科學研究也存在同樣的問題。
2014年,在此前研究成果的基礎上,加上十多年人群研究的經驗積累,我們團隊又提出建設「中國腎臟疾病數據網路(CK-NET)」的構想,目的是通過整合多源腎臟疾病數據、構建中國腎臟疾病大數據平台,借力國家級數據平台,與健康醫療大數據領域前沿技術深度融合,為腎臟疾病各個層面的決策提供依據,為腎臟疾病領域的深入研究奠定基礎,參與並助力國家腎臟疾病防控策略制定,培養腎臟疾病大數據跨界領軍人才,目標是打造國內領先、國際一流的專科重大慢病大數據中心。
現在來看,我們提出來這個整體的構想,契合目前國家健康醫療大數據的發展戰略。在CK-NET發展模式中,數據來源多元化,大數據中心所彙集的數據資源包括行業監管性、醫療保險、區域醫療平台以及10多年積累的臨床科室的研究數據。分析方法主要產生於大數據中心與公共衛生、大數據方法學專家的合作,臨床專家提出問題和需求,再與方法學專家一起「碰撞」,最終產出研究結果。
基於CK-NET框架,我們團隊在2017年6月,最終完成了一份近200頁的《中國腎臟病年度科學報告》,具體描述了我國腎臟病的各方面階段性研究結果。該報告發表在國際腎臟病領域排名第三的《美國腎臟病雜誌》(AJKD),並成為封面報道,該雜誌所配發的封面標題為《中國的大數據與臨床研究》。此外,由於在國內一系列落地的工作成果,去年,我們團隊還收到全球頂級的醫學期刊《英國醫學雜誌》(BMJ)的約稿函。
【鏈接】
北京大學健康醫療大數據研究中心
經過北京大學、北京大學醫學部相關領導的長期醞釀與籌備,北京大學健康醫療大數據研究中心(PKU-DSHM)於2016年8月28日正式成立,作為醫學部的一個實體單位,掛靠醫學部建設。
北京大學健康醫療大數據研究中心主要圍繞健康醫療大數據的「政產學研用」開展工作,據張路霞教授介紹,經過一年半的發展,階段性工作進展如下:
首先是國家級平台。在國家發改委的指導下,與解放軍總醫院團隊等共同申請了「醫療大數據應用技術國家工程實驗室」。2018年4月28日,成立了「國家級平台」——北京大學健康醫療大數據國家研究院。
其次是整合國家級、區域、行業數據資源。包括行業監管性數據、醫療保險數據、區域醫療平台數據以及臨床附屬醫院的隊列研究;
再次是北京大學內部學科交叉資源。在校內建立公共衛生學院、信息科學院、應用數學、軟體微電子等多學科交叉機制,目前已有一些非常具體的落地項目。
北京大學希望充分發揮「智庫」的作用。除此之外,還積極探討基於區域醫療中心,開展疾病診斷的智能決策和物聯網支撐的慢病管理,持續推動臨床研究。「這是一個非常熱的領域,我們非常歡迎醫院、高校還有企業來合作,一起推動應用落地。」張路霞說,「這是一個科技發展非常快的時代,但在這個領域最重要的還是『篤行』,我們希望能做出一些切實落地、對改善健康醫療有幫助的工作。」


※醫院信息化應全面參與醫學人文精神的重建
※薛萬國:醫療大數據應用的核心是服務能力建設
TAG:HIT專家網news |