當前位置:
首頁 > 知識 > 要警惕精確醫學的「白象」陷阱

要警惕精確醫學的「白象」陷阱


要警惕精確醫學的「白象」陷阱



美國現任NIH主任弗朗西斯·科林斯,精確醫療計劃主要推動者之一,圖片來自mscperu.org

前言:


2015年,美國政府啟動了一個「精確醫學計劃先導專項」,計劃招募百萬美國志願者以組成研究隊列,並進行至少10年時間的生物學大數據採集,然後再將這些大數據進行整合,構建為用於維護健康和抗擊疾病的知識網路。這樣一個龐大而複雜的研究計劃,需要恰當地平衡好經費、效率和任務等各種關鍵要素之間的關係。否則就是一隻耗錢、耗時而收益很低的」白象「。


撰文 | 吳家睿(中國科學院上海生命科學研究院生物化學與細胞生物學研究所研究員)


  

術語「白象」(White Elephant)特指一種需要花費大量財力和物力去維護而經濟效益卻很低的資產。它源於一個古代的傳說:暹羅(今泰國)的國王如果不喜歡某人,就會專門送一個珍稀的大白象給他,讓其花大錢長期飼養這頭昂貴的大白象,從而導致其破產。作為經費投入巨大的重大科學研究計劃或項目,我們不僅要考慮其科學意義,也要考慮其實施過程的研究成本和研究成果的經濟價值。這類項目一旦出現失誤,將導致巨大的損失,至少是得不償失。


2000年,美國國會曾提出一 個「國家兒童研究」(National Children』s Study, NCS)的重大研究項目,擬跟蹤10萬名健康的美國兒童,從他們出生直到21歲,分析一系列影響兒童發育和健康的因子。美國政府為此於2007年啟動了一個名為「先鋒研究」的NCS試點,招募了5000名兒童進行試點研究。在該項目籌備和「先鋒研究」花費了13億美元之後,美國國立衛生研究院(NIH)主任弗朗西斯·柯林斯(Francis Collins)在2014年12月宣布終止整個NCS項目,因為在該項目的設計、管理和花費等方面均發現了問題。有此前車之鑒,人們有必要在精確醫學(Precision Medicine)啟動之際,從經濟學的角度思考一下該計劃應該如何實施


大數據需要大投入


最近,筆者撰文詳細介紹和分析了美國的精確醫學計劃,指出該計劃注重從個體層次儘可能完整地獲取數據,包括個體的微觀層次(基因組、轉錄組、蛋白質組、代謝組等)、個體的宏觀層次(分子影像、行為方式、電子健康檔案等)、個體的外部層次(腸道菌群、物理環境、社會條件等);然後對這些不同層次的數據利用各種信息分析技術進行整合,形成一個各個信息層之間不同類型數據有著高度連接的疾病知識網路[1]。


顯然,如此規模化和完整地收集個體的相關大數據需要巨大的投入。在各種組學研究技術方面,核酸測序技術的成本下降最為明顯,已經從2000年人類基因組計劃大約一美元測1個鹼基降至當前一美元測300萬個鹼基。也就是說,如果採用目前的高通量測序儀,檢測人體基因組所擁有30億個鹼基序列需要大約1000美元。儘管現在的全基因組測序費用如此便宜,美國NIH的主任柯林斯依然強調說,只有「當經費允許時可進行全基因組測序」[2]。我們知道,美國「精確醫學先導專項」 (The Precision Medicine Initiative,PMI)計劃招募1百萬個美國志願者組成研究隊列。假設每個人做一次全基因組測序,那麼這100萬人的測序費用按照1000美元1個人計算就需要10億美元。


要警惕精確醫學的「白象」陷阱



美國NIH設計精確醫療計劃長期以及近期目標,圖片來自NIH


最新的核酸測序技術不僅成本明顯下降,而且靈敏度也有了明顯提高。過去要完成1個全基因組測序可能要用到上萬甚至百萬個細胞,而今天則可以實現單細胞的全基因組測序;當然後者的檢測費用要超過前者。單細胞全基因組測序有助於人們理解個體發育等基礎生物學過程,同時還有可能揭示腫瘤患者體內不同腫瘤細胞間的差異。因此,目前已經發表了許多利用單細胞基因組測序技術研究人體生理或者病理現象的研究成果。隨著精確醫學的興起,有些研究者也希望能夠對個體開展更為精準的單細胞基因組分析。但是,人體是由天文數字般的細胞所組成,一顆米粒大小的腫瘤組織通常擁有上百萬個細胞。顯然,即使不考慮技術方面的難度,在精確醫學的研究中開展單細胞基因組測序工作的成本也是巨大的。


在美國「精確醫學先導專項」的研究方案中,不僅計劃對這些個體進行基因組序列分析,而且還計劃開展轉錄組、蛋白質組和代謝組等各種類型生物分子的分析。需要強調的是,不同於恆定不變的基因組DNA序列、RNA和蛋白質及代謝小分子在體內不同組織或者不同條件下發生著不同的變化。即使研究者只限於對個體的血液樣本中這些不同種類分子進行組學分析,其組學分析的費用肯定不會比測序便宜,1000美元是不夠的。由於該先導專項預定對這百萬人群至少要進行10年的追蹤。即使每年對每一個體只進行一次各種組學的檢測,10年下來1百億美元都明顯不夠用。更何況一年一次的檢測不能稱為精確,最少也應該半年檢測一次。此外,「精確醫學先導專項」還計劃採用可穿戴設備檢測個體的生理變化和體能活動,並研究環境暴露是如何影響個體的健康。因此,不僅僅生物學方面的組學檢測需要花費很大,在個體的行為分析和環境分析等方面也需要很大的投入。

美國政府計劃花多少錢來開展這個「精確醫學先導專項」?目前關於專項10年所需要的總經費還沒有一個明確的說法。根據該專項2015年發布的工作報告,2016財政年度將由4個政府部門提供2.15億美元的研究經費,其中NIH提供1.3億,國立癌症研究所(NCI)提供7千萬,美國食品藥品管理局提供1千萬,國家項目協調辦公室提供5百萬[3]。筆者注意到,這些錢不僅用來支持百萬人群隊列研究,還用來支持了其它非隊列的研究,如NIH的一部分經費和NCI的經費將被用來開展腫瘤治療方面的研究[3]。顯然,用這樣的一點小錢來做這樣一個宏偉的研究計劃肯定是不夠的。事實上,針對招募百萬志願者作為研究隊列這樣一個「精確醫學先導專項」的核心任務,項目的設計者就已經在想節約費用的招數了,比如在在招募志願者時優先挑選已經擁有電子健康檔案的美國人;這些人將主要來自保健服務組織(Healthcare Provider Organizations,HPOs),如凱薩醫療機構的健康研究項目和退伍軍人健康管理局的百萬老兵項目等[3]。可以說,美國的精確醫學計劃目前只是處在一個「雷聲大、雨點小」的階段。


大數據需要大設施


人類基因組計劃最初設定的核心目標只是要認識人體基因組全部30億個鹼基序列的排列順序。為此,研究者花了30億美元和近15年的時間才完成了該計劃。但是,目前的測序技術已今非昔比,當今世界最高通量的測序儀(Illumina公司的HiSeq X 10)1年可以完成超過1.8萬人的基因組測序工作,而每個基因組的花費只不過是區區1000美元。在這樣發達的測序技術支撐下,人類基因組計劃進入到了個體基因組測序階段,要揭示人群中不同個體的基因組序列差別。美國2008年牽頭啟動了「千人基因組計劃」,英國2014年也啟動了「十萬人基因組計劃」。在不到10年的時間裡,生物學資料庫儲存的個人基因組序列已達到百萬人級的規模。一個人的基因組有30億個鹼基對,對應於一個3GB(1 GB = 109 Byte)的數據集;因此,基因組測序工作的快速發展使得基因組數據量近幾年以指數級的速度在增長;在2015年之後,基因組數據每7個月就能翻一番。


基因因組序列數據只是組學數據的一部分,轉錄組、蛋白質組和代謝組等各種組學研究都會產生大量的數據;例如,在一篇人類蛋白質組研究論文中,作者專門指出,該項研究需要用2 TB (1 TB = 1012 Byte)的內存和50 TB的硬碟作為數據分析的基本配置[4]。美國斯坦福大學科學家M.Snyder對自己進行了連續14個月的表型監測和血液樣本分析,獲得了表型組譜、基因組序列、轉錄組表達譜、蛋白質組表達譜和代謝組表達譜等單一個體的「多組學」數據,其數據量就已經達到了50 GB[5]。按照美國「精確醫學先導專項」設計者的構想,該專項的核心任務就是收集1百萬人群隊列的生物學、行為學和社會學方面的數據;大家可以想像一下該項目的數據量將會有多大。事實上,僅僅2015年一年時間,生物醫學研究產出的數據估計就已經高達500 PB(1 PB = 1015 Byte)。

生物學大數據的獲取只是「萬里長征邁出的第一步」;大數據的存儲、管理、分析和共享等依然面臨著諸多的挑戰。「癌症基因組圖集」(The Cancer Genome Atlas,TCGA)是NIH在2006年牽頭啟動國際癌症基因組項目,針對50種不同類型的腫瘤,每種腫瘤採集500份樣品進行基因組測序研究。TCGA項目在2014年底宣告完成,共產生了20PB的腫瘤基因組數據。這個腫瘤基因組資料庫如此之大,只有那些具有超級計算能力的研究機構才有可能「玩得轉」。即使是具備了強大的計算能力的科研單位,僅僅下載這些數據就需要花上4個月的時間;而按照美國一所普通大學的網路能力,則需要15個月以上的時間才能夠下載完這些數據。


早在1988年決定要啟動人類基因組計劃之際,美國政府就已經意識到,需要建立保存和處理生物學大數據的大科學設施,於是以NIH的基因庫(GenBank) 為基礎建立了美國國家生物技術信息中心(NCBI);歐盟隨後於1992年也在英國組建了歐洲生物信息研究所(EBI),它們與在此之前日本建立的DNA資料庫(DDBJ),形成了三大國際生物學大數據中心,負責保存各國產生的相關數據並進行共享。隨著生物學大數據的迅猛增長,原有的大數據設施已明顯不夠用,各發達國家正在計劃建設新的生物學大數據設施;例如,歐盟2010年發表的《科學研究設施戰略規劃報告》提出,計劃在5年時間內投入6億歐元,建設一個歐洲生命科學研究生物信息基礎設施(European Life-Science Infrastructure for Biological Information,ELIXIR)。


把生物學大數據的獲取作為主要任務的「精確醫學先導隊列專項」,需要考慮如何處理海量的生物學大數據。 2015年發布的該專項實施計劃書共有100多頁,其中近三分之一的篇幅專門討論了數據管理方面的內容,提出了源於所有隊列參與者「核心數據集」的概念以及建立存儲這些核心數據集的協調中心(Coordinating Center)[3]。需要強調的是,該專項的設計者在報告中提出,「協調中心」不是一個實體,而是一個獨特的單一數據使用界面;具體的數據存儲和管理可以考慮採用「雲計算環境」(Cloud Computing Environments);由此需要建立新型的「公共與私立」(Public-Private)關係以及「學術與商業」(Academic-Commercial)關係[3]。在「千人基因組計劃」中,NIH已經在探索這種數據管理的新模式,即讓亞馬遜公司旗下的雲計算公司「亞馬遜網路服務」負責存儲該計劃的全部數據(總量達200TB)並對公眾開放。顯然,這種策略的一個出發點就是調動民間的積極性,從而減輕政府的經費壓力。但是,面對「精確醫學先導隊列專項」將產生的海量數據,如何進行管理依然是一個巨大的挑戰。


結語


這樣宏大的任務要想順利完成並達到預定目標,項目的領導人需要具有良好的全局意識,並能夠恰當地平衡好經費、效率和任務等各種關鍵要素之間的關係。為此,NIH在考慮精確醫學先導專項的負責人時,選擇了一個通訊領域的工程師迪什曼(E.Dishman)。NIH主任柯林斯這樣評價迪什曼:「一名社會科學家和研究者、一位企業家和商業領袖、一個患者和患者支持者、一名政策擁護者和思想領袖。」[6]在其任命後的採訪中,迪什曼也表現出他對「白象」陷阱的警惕:「如果精確醫學先導隊列項目想要滿足所有人的想法、研究所有看到的疾病、或是去收集人們能夠想像到的所有類型的數據,那麼我們註定會在財政和智力上雙重破產。」[6]


製版編輯:葉水送丨


參考文獻


[1]吳家睿. 精確醫學的主要特徵. 醫學與哲學.2016 . 37:1—7.


[2] Collins, F.S., Varmus H. A New Initiativeon Precision Medicine. New Engl. J.Med. 2015. 372:793—795.


[3] PrecisionMedicine Initiative (PMI) Working Group. The Precision Medicine InitiativeCohort Program- building a Research Foundation for 21st CenturyMedicine. 2015. https://www.nih.gov/sites/default/files/research-training/initiatives/pmi/pmi-working-group-report-20150917–2.pdf


[4]Wilhelm, M..et al. Mass-spectrometry-based Draft of the HumanProteome. Nature. 2014. 509:582—587.


[5] Chen, R..et al. Personal Omics Profiling Reveals DynamicMolecular and Medical Phenotypes. Cell.2012. 148:1293—1307.


[6]Kaiser, J. Q&A: Tech Expert and Cancer Survivor to LeadU.S. 1-million-person Health Study. Science. 2016. DOI: 10.1126/science.aaf9903.


註:本文原載於《科學文化評論》雜誌2016年第4期,略有修改。


本頁刊發內容未經書面許可禁止轉載及使用


公眾號、報刊等轉載請聯繫授權


copyright@zhishifenzi.com


知識分子為更好的智趣生活ID:The-Intellectual


投稿:zizaifenxiang@163.com

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 知識分子 的精彩文章:

第一位留美學醫的中國女性:金韻梅的傳奇一生
北大老師致中小學生家長:奧數,孩子該不該學?
2016中國民生髮展報告系列(二)
鼓勵女性參與科學,對抗性別不平等
川大學者建議:戒奢侈採暖「陋習」,換一口乾凈空氣!

TAG:知識分子 |

您可能感興趣

醫學的象徵·蛇杖
十條笑話:醫學界要好好研究黃牌在骨科和運動醫學方面的神秘療效
這裡要醫學人才!要醫學人才!要醫學人才!重要的事情說三遍!
看「精準醫學」如何變革癌症預防?
被誤解的康復醫學,魔幻康復醫學!
鬼壓床真的是醫學上解釋的夢魘嗎
精準醫學「新指針」 蛋白質組階段性成果公布
新英格蘭醫學雜誌研究稱,糖友不要怕,堅持五招可消災
精準醫學:醫療新視界
醫學護膚品的真相
醫學專家:警惕!女性尿毒症的6種早期癥狀,一定要注意
雅奇醫學護膚品 解讀醫學護膚新理念
《自然醫學》:AI可用於兒科疾病的評估和精確診斷
美國醫學雜誌證實:太極拳是「動葯」,可用於心臟病康復治療
醫療損害鑒定:醫學會準備好了嗎
醫學亂象,何止疫苗
關於女神病的醫學淺析
得了糖尿病,為何要做核醫學腎動態顯像?
鬼壓床:你不知道的靈異科學,醫學上稱睡眠癱瘓症
慢性乙肝抗病毒治療 要聽懂:醫學名詞!