當前位置:
首頁 > 知識 > IBM中國研究院謝國彤:做醫療人工智慧是一件非常謹慎的事情

IBM中國研究院謝國彤:做醫療人工智慧是一件非常謹慎的事情

【編者按】「北大AI公開課」第12講,IBM中國研究院認知醫療研究總監、IBM全球研究院醫療信息戰略聯合領導人謝國彤做了題為《個性化、循證的智慧醫療》的演講,並與北大人工智慧創新中心主任雷鳴老師就AI技術在醫療領域的應用等問題進行了深入探討。

本文發於Xtecher,億歐編輯轉載,供業內人士參考。

以下是Xtecher整理的本期演講內容乾貨:

非常榮幸有機會來跟北大的同學和老師們分享一下IBM在醫療方面如何用人工智慧來解決醫療問題,以及我們做過的一些嘗試。今天,我想跟大家分享一些我們看到的趨勢和具體的案例,我們用什麼樣的技術解決什麼樣的問題,希望能夠給大家一些啟發,我們可以一塊討論怎麼樣把醫療AI做得更好。

我叫謝國彤,負責IBM中國研究院的醫療研究工作,同時,IBM全球有12家研究院,除了南極洲,每個大洲都有IBM的研究院,我們整個醫療研究團隊是全球性的,我也和另外幾位同事一起負責制定全球IBM研究院在醫學信息學方面研究的重點。

這是第12節課,各位已經聽到了很多人工智慧的技術,包括人工智慧在產業的應用,不管是在金融、交通或者駕駛,包括生命科學各個方面,可能都聽過了很多案例。其實這場人工智慧運動,IBM可以說是始作俑者。

在2011年,IBM推出了Watson系統,能夠與人類進行智能問答競賽。從2011年到現在,已經過去六年了,我們的體會是把一個通用的人工智慧系統應用到行業不是簡單的事情,不是說你有一個通用的演算法,結合行業的數據一跑,就可以出來一個結果,就可以應用去改變這個行業。這是一個很美好的夢想,但是現實要比這個複雜。所以在過去的六年時間裡,我們經過了大量嘗試,試圖把這樣的技術應用在能源、交通、金融、醫療的方方面面,也取得了一些成績。

IBM做醫療,核心只想解決一個問題,就是怎樣利用數據挖掘和人工智慧的技術,從海量的醫療數據中挖掘出證據,利用這些證據給患者提供循症的個性化醫療服務。這其實不是一個非常獨特的vision,因為數據分析技術從誕生的第一天就跟醫療有關係,現在很多人工智慧的基礎、概率論的發明其實最早就是用來解決歐洲的疫苗接種問題。

所以,數據分析和醫療從第一天起就是關聯在一起的。但是這件事為什麼到現在又成為一個熱門的話題,成為一種可能?我個人認為有兩個主要原因:一是計算機算得快了,算得過來了。二是數據在那,有東西可算。

先看看計算機算得過來了。各位有很多是學IT的,隨著不管是像Hadoop、Spark這樣的並行計算,還是像GPU、FPGA這樣的硬體加速發展,計算機的處理能力有了性能上的飛躍發展。同時,我今天也借這個機會跟大家分享在晶元這個領域計算能力的突破性發展。

就計算機而言,圖靈那篇論文證明了計算機是能做出來的,然後馮·諾依曼從工程上提出了馮·諾依曼架構,證明了計算機是怎麼做出來的。這個工作基本上是在二戰前後,1950年左右。半個多世紀過去了,計算機最核心的計算部件CPU並沒有什麼本質的變化,跟當年馮·諾依曼和圖靈設想的沒有太大變化,只不過是我們做的更小了,集成度更高了,所以它的計算能力更強了。但是最近幾年,計算能力方面,CPU的計算技術有了突破性發展。

第一個我想介紹的就是類腦晶元。不光是IBM,中科院、其他一些公司都在做這方面的工作。類腦計算晶元的核心想法完全突破了馮·諾依曼通過加法器的那一套框架,而是從神經元的角度做了一個晶元。在這個晶元里,沒有我們在通用的CPU中看到的東西,而是一個一個的神經元,神經元之間通過突觸連接。這樣的架構天生就是一個神經網路,利用這樣架構的計算機去完成基於神經網路的演算法,比如CNN或者DNN的演算法,有天生的優勢。

目前,一個晶元上有上百萬個神經元,神經元之間的連接叫神經突觸,可以達到兩億五千多萬個。這樣一個非常複雜的晶元功耗非常低,只有70毫瓦。70毫瓦是什麼概念?一部智能手機的功耗大概5瓦,它的能耗是你手機的百分之一,是一台筆記本電腦的千分之一。所以設想一下,一個擁有上百萬神經元、幾億個神經突觸的晶元可以做得如此之小、如此之低功耗,可以運行模式識別或者深度學習的task,然後可以放在各種各樣的感測器上。這樣的話,大家想到邊緣計算,所有的事情都成為了可能。所以,這是計算晶元技術的一個大突破,類腦晶元用人腦的神經元架構去構造晶元。

第二個我想介紹的是另一個計算架構上的突破。現在很多人在講量子計算,IBM、谷歌、中科院、其他很多科研機構都在進行這方面的探索。IBM在這個領域已經超過30年。在量子計算機里,核心叫量子Qbate,Qbate特別神奇的一點是它可以既表示0,又表示1,就是大家講的類似「薛定諤的貓」等的一些概念。所以,一個一位的Qbate就可以同時表示0和1,而且是帶概率分布的。如果是兩位的Qbate,它就可以同時表示00、01、10和11,它可以表示一個二維的個向量,而且同時表示四個狀態。所以,大家可以想像,如果是一個64位的Qbate,它可以表示一個64維的向量,同時表示2的64次方的狀態,它帶來的計算能力的突破是不可想像的。

IBM在今年3月份推出了一個名為IBMQ的量子計算機,聽起來很萌萌噠。我當時看到圖片的第一感覺是好像看到了四五十年代的傳統主機,大得像一間房子。目前這個機器在IBM位於紐約的研究院總部。目前這個計算機只有五個量子位,是一個很小的量子計算機。

但它主要是實現了一個技術上的突破,可以保證五個量子位有穩定的輸出。IBM新的計劃是推出一個有50個量子位的量子計算機,其實我一開始也不太理解為什麼要做50個,後來我查了一些量子計算的文章,說目前49位的量子位從理論上推算可以達到現在所有超級計算機的計算水平。所以,如果能夠做到50位,你就可以beat目前所有的超級計算機。所以,這個比類腦晶元會更遠,它可以預見的未來是非常可觀的,以後所有的演算法設計,所有的軟體,如果有無限的計算能力來支撐,很多的想法都會完全不一樣。

從計算能力跳回到醫療本身,第二個因素就是醫療數據的爆炸。這是醫療界關於什麼叫醫療數據的調研,或者說從IBM視角來看,醫療數據分析包括什麼。簡單地說,它包括三大類數據:臨床數據、基因數據和大健康的數據。臨床數據簡單地說就是醫院產生的數據,一個人去醫院,會做檢驗、開藥、拍片子,這都是醫院產生的數據,有一個測算說臨床數據對人健康的影響是10%;基因數據是人與生俱來的數據,有很多研究說它對人類健康的影響有30%。

所以,有很多人在做基於基因的診斷,包括腫瘤的治療。當年女神安吉麗娜·朱莉做乳腺切除,就是因為她經過基因測序發現有一些遺傳上的變異,所以進行了治療;大健康的數據就是目前在醫院和基因之外的所有跟健康相關的數據,包括人的飲食、運動、工作,包括人在社交媒體上發泄的一些情緒。這些因素全部都是大健康的數據。

從醫療數據分析來說,就是要從海量的醫療數據中尋找醫學證據,然後利用這些證據,提供更加個性化、基於證據的臨床治療。

從IBM的視角來看,有了計算能力,有了數據,目前可以做三件事情:1、做一個醫療數據云,把醫療數據先存起來。2、做分析,對這些醫療數據進行深度的計算和分析,把它變成模型,變成一些API。3、做解決方案,針對不同類型的醫療領域的客戶,做這些客戶能夠使用的具體的軟體和解決方案。

稍微再說細一點,在醫療雲里要解決兩個問題:一是解決多模態醫療數據的存儲問題。醫療數據是多模態數據,有結構化很好的數據,比如化驗單、處方;它還有一些半結構化的數據,比如住院小結、入院的首頁,這樣的病例里有大段的文本;它還有完全無結構化的,比如醫療影像;它還包括基因測序這樣的數據,一個人的測序有幾萬個基因,有各種各樣的變異組合;它還包括時間序列的數據,比如在醫院的ICU里,一個人插著各種各樣的儀器去測量血壓、心率、脈搏等各方面的流數據。

這些數據是不同模態的,有些數據適合用關係型的數據去存儲,有些數據適合用時間序的資料庫去存儲。所以,目前沒有一種單一的數據模型能夠覆蓋這種多模態的醫療數據,如何有好的雲平台去處理多模態的醫療數據,是要解決的第一個問題。

第二個問題是安全和隱私問題。我們知道存在很多關鍵信息泄露、信用卡信息泄露。醫療數據是個人非常隱私的數據,保護這些數據是雲平台一定要做好的。所以,在歐美一些國家都有針對醫療數據保護的法規,根據這個法規,所有的醫療數據大概有20幾項關鍵的隱私數據,比如姓名、住址、電話、身份證號等,這樣的關鍵信息在進行數據管理時,必須要打馬賽克,去隱私化。同時,要對數據進行強加密,即使數據被泄露,也是不可解密的。同時的話,對所有數據的訪問,都有一套嚴格的訪問控制,通過這樣的方式,來保證數據的安全性。

分析層方面,簡單而言做兩件事情。第一件事情是對多模態醫療數據的分析,不管是結構化病例數據、影像數據,還是文本數據、時間序列數據,目前不存在一種單一的技術能夠對所有的數據進行完美的分析。所以,目前針對不同類型的數據有不同的分析方法,有一些適合用深度學習的方法,有一些適合用時間序列的方法,有一些適合用回歸分析的方法或者分類的方法、聚類的方法。用不同的方法來分析不同類型的數據。

第二點,分析與醫療領域相關,醫學裡有一些特定的問題,不是去分析照片是誰,而是分析數據里疾病風險的因素是什麼,怎樣做疾病的預測和預防,怎樣對患者進行精準分析,可以對患者進行個性化的治療或者有不同的治療方案時哪種方案對患者反應比較好,包括影像識別怎樣把影像中間的病灶自動發現。這些信息都有非常強的醫學知識,醫學知識跟分析技術的結合是要解決的核心問題。

從解決方案的角度來看,醫療是一個非常複雜的行業,有醫院、醫生、藥廠、醫療設備製造商、健康管理機構、醫療保險公司,但是它們的訴求不一樣,所以你不可能做出一個可以滿足所有人需求的解決方案。所以,你必須要利用底層的雲平台和分析技術針對不同類型的客戶作出不同的解決方案。

在這個解決方案里,我們有針對醫院這樣的醫療機構的解決方案,包括像腫瘤的個性化治療、Oncologyand Genomics、醫學影像的分析;有針對葯企的,比如幫助葯企做新葯的發現和上市藥物的有效性、安全性各個方面的分析;有針對慢性病管理的,幫助健康管理機構對常見的慢性病人群,比如高血壓、糖尿病、慢性腎病、多種並發性慢病的患者進行管理的解決方案;也有針對醫療保險機構的,幫助醫療保險機構更合理地按照價值來付費,進行疾病管理。這些都是IBM不同的解決方案。

目前的平台上,IBM通過過去兩年的收購,已有超過兩億美國人的醫療保險數據,有超過一億美國人的電子病例數據,有超過十億張醫學影像的片子,有美國幾十個州的慢性病管理數據,這些數據全都在目前的雲平台上。把這些數據關聯在一起做分析,就會發現非常有價值的,從任何單一數據源都無法發現的一些insight或者evidence,可以用來支持各種各樣的應用。

接下來,我給大家介紹一些具體案例。第一個我想介紹的是沃森個性化腫瘤治療助手。

首先,腫瘤是一個非常惡性的疾病,目前針對很多腫瘤沒有什麼好的辦法,但它同時又是危害非常大的。以中國為例,我們中國每年新發的腫瘤大概超過四百萬。以胃癌為例,全世界每年新發的胃癌大概超過40%是中國人。同時,腫瘤的治療又是一個很困難的事情,一方面在於這個疾病本身比較困難;二是這個疾病裡面的治療方法層出不窮,各種靶向藥物、各種新的治療方法反覆出現。

一個腫瘤醫生要想當好醫生,需要讀超過一萬篇文獻,每個月跟腫瘤相關的新的科研文獻超過一萬篇,醫生讀得過來嗎?這是不可能的。所以,這個解決方案核心的技術是自然語言理解技術,讓機器代替人去讀書。這個系統讀了兩千多萬篇文獻,從這些文獻中做自然語言的理解,去抽取裡面的疾病、癥狀、診斷、治療,包括患者病情之前的關係,構成一個非常複雜的知識圖譜。

基於這樣的知識圖譜,它能實現的功能其實很簡單:面對一個患者,這個系統會自動地從這個患者所有的病例信息里自動抽取上百項關鍵信息,這些信息會在介入後台的知識圖譜進行很複雜的推理過程,最後它會給出推薦多個治療方案和不同的治療方案跟患者的契合程度。這樣可以幫助腫瘤科醫生更好地用最新、最好的治療方案給患者提供個性化治療。Watson Genetics從基因維度切入,與前面的解決方案一起解決腫瘤治療。

腫瘤本質上是一種基因變異導致的惡性疾病,醫生就想能不能直接用一些藥物打靶,靶向作用到那些變異的基因上來控制腫瘤。所以,這個系統它做的事情也很簡單,它拿到一個患者的二代測序結果後,通過分子的profiling,把患者所有的變異基因找到,進行很複雜的治療通路分析。這個通路分析是通過在幾千萬份文獻中學習各種藥物、靶向、基因變異、蛋白質作用過程等方方面面構成的一個很複雜的網路。

它通過在網路上進行推理,給出相應的靶向藥物治療的推薦。前一階段有一個新聞報道,日本東京大學有一個患者得了非常罕見的白血病,醫生沒有見過,沒有辦法確診,甚至做出了誤診。藉助這個系統,醫生很快找到了患者可能得的白血病是什麼,同時推薦了一些靶向藥物,挽救了患者的生命。

Watson系統先讀了很多書,包括三百本期刊、二百多本教科書、幾千萬文獻。這就是一個實際系統使用的界面,來了一個患者系統會推薦,每一行是一個治療方案。綠色、紅色、紫色,綠色的是最好的,包括放療、化療、手術治療、藥物治療等各種不同的治療。同時,每一種治療方案,系統會提供更多的信息,比如這個治療方案的愈後、存活率、毒性等情況。

所有這些信息不需要醫生提前手工錄入,而是由系統自動地從幾千萬份文獻中利用自然語言理解技術,把這些關係的信息抽取出來,構造成一個智庫。然後,這些信息在給患者治療時,會推送到醫生面前。其實在很多醫院,面對腫瘤治療等疑難雜症,都會請很多專家,每個專家給出自己治療的意見,包括這個方案的優缺點。

這個系統就相當於是一個讀了所有最新文獻的專家,把不同的治療方案,包括它的副作用,包括不同治療方案、藥物之間的相互作用,可以生成一本三四十頁的報告提交給醫生,幫助醫生作出最好的判斷。它不是代替醫生,而是幫助醫生作出一個針對患者最有利的治療方案。

第二個想介紹的案例是現在在醫學AI里非常火的醫學影像分析。影像極大的推動了醫療的發展。最早期,醫生看病主要靠一個聽診器,後來出現了X光,然後出現了核磁、超聲等各種各樣的診斷設備。這些影像設備可以幫助醫生更好地看到患者體內的信息,甚至包括病理,通過組織切片,用高倍顯微鏡看到細胞層次的變化,利用這樣的信息可以作出更加準確的判斷。

影像對醫學的作用確實太大了,所以在2003年,發明核磁共振的兩個物理學家和化學家竟然得了諾貝爾醫學獎。核磁共振極大的顛覆了醫療的診斷和治療。

從影像角度來看,影像也是多模態數據。有比較常見的二維影像,比如眼底影像、皮膚癌影像,或者消化道的影像;還有三維影像,通過CT或者核磁用切片掃描的方式,一次對人體進行上百次的掃描,生成完整的三維影像,這樣也能很好地用來做各種診斷和治療;還有一類是病理影像,主要做很多腫瘤的治療,它是要從患者的疑似腫瘤部位取一個組織進行切片,放在高倍顯微鏡下,是幾萬乘幾萬像素的高解析度影像。

往往一張病理影像的片子就有3到4G的大小,這樣的影像可以又快又好地提高醫療水平,但它的分析同樣是一個很困難的問題。你如果想約做一個核磁或者做一個CT,在協和醫院你可能需要約一周,甚至一個月的時間。機器可以不休息,但是人要休息,人看不過來,這就是現在影像分析面臨的一個很大的問題,三甲醫院的醫生有大量的片子看不過來。

同時,CT、核磁等,一個患者就是幾百張,更可怕的是消化道影像,有很多現在已經有膠囊機器等新的醫療設備,吞到肚子裡面,一次拍一個視頻出來。做一次檢查,可以生成的影像的幀數大概在三萬到五萬張,有病變的部位不超過30張,從3萬張中找出30張相當於大海撈針,需要醫生花大量的時間過濾無效的片子。所以,如何利用識別技術自動地發現病灶,提高醫生看片的效率,是影像技術進步最迫切的需求。

機器看片原理很簡單,就是先模擬醫生看一些視覺上的特徵,用一些比較經典的影像分析或者模擬識別的方法,通過觀察病變部位的位置、大小、顏色、邊緣形狀等視覺特徵,判斷這個到底是不是一個惡性的肺結節或者是不是某一種皮膚癌。另外,計算機可以在像素層級上看像素的灰度變化,利用卷積網路在像素層級上進行計算。所以,它可以比人看得更細緻。你可以通過構建一個多層的神經網路,很好地從這些像素中間提取隱含的特徵信息,利用這樣的信息來做判斷。

再往前走,影像科醫生無法在進一步識別,從計算機的角度來說,它可以看多模態的數據,而不僅是影像數據,還可以看病例信息和基因測序結果。多模態的信息融合在一起,可以達到更好的效果。我們做過很多實驗,用影像分析疊加一些其它模態的數據,比如病例數據,從病例數據裡面獲知患者的黏性、病史、治療史,提取關鍵信息,最後作為病變識別的依據,用這樣的數據融合,診療精度可以提高10%以上。

介紹兩個例子,一個是黑色素瘤分析。一部分是黑色素瘤,一部分不是,系統給出了一萬張影像,這一萬張影像有標記。但這個標記的影像,交給機器,利用深度學習的技術去學習,之後構建模型,再從測試級里提取三千張讓三個醫生共同判斷,判斷結果人達到的精度,約84%,計算機可達97%。其實在很多模態的影像上都有類似報道,精度都可以達到90%到95%。

每一次檢測生成的數據特別多,有3萬到5萬張,同時裡面有很多不均衡的數據,若想能夠自動將這些出血點檢測出來,就需要遷移學習技術,很多數據的預處理技術,包括data augmentation或者data resampling,然後構建出來深度學習的網路,達到更好的識別精度。

這是我介紹的兩個影像相關的例子。我給大家看一個小視頻,是針對皮膚癌的一個模型。我們可以看一個小演示。這個演示不需要什麼器材,只需一個高清攝像頭就可以看到怎麼工作。它的原理就是用任何有攝像頭的移動設備,把一個色斑拍下來。我一個同事用自己的手實驗。這就是他拍完的影像,把它上傳到後台的雲伺服器上,裡面有一個訓練好的模型。這個模型主要就是做分類工作。數據上傳後,經過後台計算,就會給出一個結果。同時,系統會自動把已知跟它類似的確診影像也反饋回來,幫助醫生及者患者做更好的判斷。從這個角度,它選了一個已知的黑色素瘤確診的影像。

除了影像技術分析及文本分析,我想給大家介紹的第三個案例叫「真實世界證據分析」。這個詞有點拗口,真實世界證據它對應的詞叫做RCT(雙盲隨即對照臨床實驗)。RCT是目前工人的一個「金標準」,判斷藥物或治療是否有效,必須要做RCT實驗來證明藥效或治療方法的效果。這樣的一個實驗平均要花十年以上的時間,資金支出會達到十五億美元。而且成功率不超過10%,大量RCT做到一半就放棄了。

RCT非常耗時、耗力、耗錢。真實世界正應就是跟它做對應的,RCT實驗一般它會組織幾百個人分組進行實驗積累數據,每天生成大量醫療數據,以中國為例,一年就診的人次接近70億,相當於是全國人民每年平均就診5次。這70億次就診產生了大量臨床數據,但這些數據都散落在各家醫院,並沒有很好的用於數據分析。這些信息是可以被用來做真實世界證據挖掘的,利用真實世界的信息挖掘出來的數據,不管是用於疾病治療,還是用於疾病預防都是非常有價值的。

真實世界數據的作用就是輸入、輸出,把真實世界的數據,如:病例、醫保以及疾病等級數據輸入進來,輸出各種模型,例如:中風病人再中風的預測模型,心梗病人的死亡風險預測模型,某種藥物的療效模型,這樣的模型通過一個pipeline得到的。我們發現兩點有趣的事情,第一,可以有一個通用的pipeline去解決真實世界數據分析的問題,因為這個過程重複性很強,包括前期導入數據、數據整理、患者群構建、特徵抽取、建模、模型的驗證等等。

第二,這個分析我們做過各種各樣不同的病種,有心血管病、糖尿病、腫瘤等。不同的疾病所需要的分析很多是通用的,比如疾病風險預測分析、患者相似性分群分析、治療有效性分析或是一些患者依從性分析。這樣的分析都可以變成一些可以用的模塊,作為一些插件,在這個平台上來做模型的生成。其實簡單地說就是一個咖啡機,你把數據放進來就會生成咖啡,但是裡面有很多參數,你是要調整的,你是要喝美式、拿鐵還是摩卡,你要進行調整。包括這裡面有很多參數要調整的,但過程是相通的。

給大家舉兩個例子,這裡就涉及到一些醫學知識。第一是我們做的疾病風險預測的例子,這個例子想幹什麼,這個資料庫裡面有45000個心梗的病人,每個病人有超過八百個變數去描述這個病人包括他的基本信息、治療信息、臨床信息各種各樣的信息。那這個醫生想知道哪些因素會導致這個患者出現院內死亡,患者院內死亡可能性是多少,這個就是疾病風險預測的典型例子。這個風險模型以前是有的,TIMI模型是醫學界公認的目前已知最好的心梗病風險預測模型,它的性能AUC大概是0.76,利用我們的方法,我們把AUC做到0.87。同時,我們發現了24個新風險因素,有很多風險因素是非醫療性質的,比如社會性因素或就診醫院因素。比如,和配偶生活是一個非常好的保護性因素,就是家庭幸福的人治癒可能性更高。

醫生常常也做這類分析,他們一般會有自己的假設,從800個量裡面挑出15個20個,然後從4400萬個人裡面挑出一千個人,用經典統計方法去做單變數多變數的回歸,去看是不是有顯著性,這是目前醫學統計常用的方法。但是用這種人工智慧方法去做時,我們就會用很多新的一些方法,比如做新的特徵抽取。舉個例子,我們會用共生的模式挖掘,去看這個患者既有高血壓又有糖尿病共病,會不會是一個更加有意義的風險因素。這些因素以前醫生不會考慮,是我們通過一些挖掘的方法得到的。包括一些共症共治,比如病人同時服用A葯B葯進行治療,可能是一種很好的保護性因素,以前不會考慮A加B,或者A加B加C這樣的問題。還有包括一些生理指標,比如血壓。

醫生首先有自己的家屬,從800個量裡面挑出15到20個,人群他不見得用4萬個人,裡面挑出一千個人做單變數多變數的回歸去看統計是不是有顯著性,這是目前醫生使用統計常用的方法。

用人工智慧方法來做的時候,比如說新的特徵的抽取,舉個例子我們會用一些共生的模式挖掘去看,這個患者可能既有高血壓又有糖尿病,這樣的一種共病可能是一個更加有意義的風險因素,這些因素以前醫生不會考慮,這是我們通過一些挖掘的方法得到的,包括一些共治,比如說這個病人同時用了A葯和B葯進行治療,以前醫生可能用A或者B,並不會考慮A+B,還有像包括一些生理指標也是這樣,比如說血壓當前值是多少,如果這個病人血壓高壓是150,他是從90連續漲上來的還是一直持續到150,還是從180掉下來,醫生不管,醫生只通過一個時間來做判斷,其實數據時間序列的信息沒有很好的利用起來,這些都是用人工智慧的方法,不管用RN建模或者其他分析的方法,可以很好的捕捉到數據之間時間序列的信息,利用這樣的信息可以做更好的預測。

我們最後發現我們把所有的因素,我們不光發現哪一些因素有影響,同時每個因素的權重包括它的分類都列出來了,醫生就會說這個病人因為病情太嚴重導致死亡的,還是治療不給力導致死亡的,同時每個病人都會按照風險排一個序,橫坐標是一個病人的患者號,所以高風險、中風險和低風險所有病人一目了然,這樣可以幫助醫生更好對病人進行管理。

第二,我介紹一個叫「患者精準分群」的分析。這個也是精準醫療裡面非常重要的,什麼叫精準?有兩個極端,一個極端觀點認為每個人都是不一樣的,因為每個人的基因都不一樣,每個人基因變異也不一樣。「個體化治療」要個性化到每一個「個體」,這是很好的理想,但是現在做不到。另一種觀點就是人群治療,基於一個人群的定義,比如說二型糖尿病,這就是一個定義。醫生只考慮「二型糖尿病應該怎麼治?」的問題。目前很多精準醫療就是希望在這兩個極端之間找到中間狀態,以中國為例,心血管病患者2.6個億,糖尿病患者一億。

這一億人肯定是不一樣的,但肯定不是一億種情況,怎樣在中間找到一個更好的合理分群並進行個性化治療。這裡我們做了一個針對房顫病人的案例,房顫就是心房顫動,它是一種叫心臟慢性指征,本身無害的,但患有這樣的疾病,會導致很多惡性心血管事件,包括心梗(心肌梗塞)、腦梗(中風)。我們拿到了大概兩萬人的數據,每個病人有超過1600個特徵進行描述,醫生要做的事就是要判斷這個病人是高危,還是低危。如果高危,怎麼治療,是不是要對患者進行中風預防。如果這個治療就這麼簡單也就罷了,但是很多治療都是有危害性的,用藥過量會適得其反。

所以,醫生每天都會面臨「生死抉擇」。這是個問題對醫生來說,按照經驗,他們知道有些病人不該吃的我給他吃了,但是很不幸,我用以前的模型還不夠精準,他發現不出來那些不該吃的病人。所以,我給分了五群。這裡就看出來這五群患者將來中風的發病率有顯著的不同。

可以發現,有一群人其實屬於過度治療,這群人被傳統方法認為是高危,其實並不高危,只不過他以前的模型沒有辦法捕捉到這個細微的區別。

同時,又發現這群人適用某種藥物,針對此類人群,吃這個藥物中風發病率是9%,否則發病率就近18%。所以,這一群人對於某種治療方案反應特別好,而這個治療方案在所有人群眾其實沒有顯著差異。所以,這就是一個精準的分群方法,能幫助從病例數據中挖掘出更精準的患者分群,然後去幫助醫生做個性化治療。其實分群也不是新方法,但傳統上分群是無監督的,很多結果在臨床上沒有意義。我們一些核心方法,利用結局驅動的方法,我們可以把患者按照中風的發病率區分開來。這個方法,

第一,會判斷哪些因素對患者聚類是特別重要的。同時,每個因素的權重是多少。利用這樣一個方法,就可以把患者分得特別開,同時,可以去看每個不同人群對不同治療方案的反應。同時,我們來看一下這個系統是怎麼樣去工作的。一開始能看到各種各樣的數據。這個數據集,可以看到不同的列,大概有一千多列的數據。如果選中了這個數據,到下一步它就會出現各種分析方法,每一塊是一個分析方法,有疾病預測分析的,有患者分析的,還可以看分群的過程,一個宏觀的分析流程是什麼。

如果你選中了這樣一個分析模塊,你就選中了數據集,選中了分析方法,有一些參數可以調整,比如說想分幾個群,用什麼方法分群,關注點是住院、死亡還是中風等。分析任務生成後,送到後台運行後就可以看運行結果了。這是第一步,你會看到所有數據項,包括數據分布,這都是在做分析之前做的數據探索,去了解數據的樣子,關鍵結局有沒有,人群是什麼樣的。然後,就可以看到分析結果,這個分析結果包括這裡邊每個點表示一個人,不同的顏色表示他被分到不同的群,這是那五群人。

然後,包括這五群人在不同的觀念信息上的一些分布,比如患者之前是否得過中風,有沒有糖尿病及治療有效性等。所有的這些信息都會呈現出來,幫助數據科學家很好地理解。這個過程看起來很簡單,其實整個做這樣一個分群,是經過大概70個步驟,每個步驟完成了從數據的治理、人群的構建、特徵的提取方方面面的過程。通過這樣的一個過程,最後得出來一個患者精準分群的模型。它也從此形成了一個模板,有類似新數據要做分析,用這個模板就可以得到分析結果。這裡很快的給大家分享一下針對結構化變數的定義,做這種真實世界證據挖掘的工作。

第四個我想介紹的叫「認知決策」。其實這個決策知識也不是新話題,從人工智慧誕生的第一天起就有了,專家系統其實無非就是想去怎麼樣把專家的知識變成一些計算機可以去執行的規則。上世紀50年代,斯坦福就做了一個針對醫學專家系統,當時他們做了幾百套規則,針對血液病的治療,可以給血液病患者進行診斷和治療。這就是前面的第一步,如果各位有了解過醫療,裡面有很多像醫療指南、臨床路徑,這都是醫生總結出來的規律和知識。

但只從書本當中學到的知識是有缺陷的,往往學習到的知識比較抽象,實際使用時會有各種各樣的問題。以尿病治療為例,你可以看到當這個指南告訴你這個病人血糖控制的不好,而且目前使用了雙胍類的藥物,還控制不住,他應該用雙胍類和磺脲類聯合治療。指南只能告訴你這些,怎麼聯合?選擇哪種雙胍類藥物?選擇哪種磺脲藥物?

醫生需要的是一個可操作的action信息,指南很難提供。我們開始嘗試另外一條路徑,就是用數據驅動的,用機器學習的方法,不管用哪種模型,都可以去做這種基於數據的推薦。簡單地說,類似的病人都是怎麼治的?治完之後效果如何?以此為基礎,就可以得到治療方案。這樣的結果,好處是所有知識都是從數據中學習出來,所有推薦是接地氣的。但缺點在於,數據往往都是有局限性的,知識是從這個數據上學出來的。

第二點,很多計算機的模型是「黑盒子」。對醫生來說不可解釋,不能得出像水晶球一樣的模型,模型可以告訴我們質量方案,但不告訴我為什麼。在這個過程中就發生了一個真實的例子,分析幾萬糖尿病患者超過五年的數據,我們發現最好的辦法就是上胰島素,這個效果最好,降糖最快。醫生說,你這不是開玩笑嗎?沒有嘗試,我們這個治療一二三四線,胰島素是最後的,我一線、二線、三線藥物控制不住的時候才會這樣。

這裡有一個生物邏輯在前,生理生物學的邏輯在背後的問題。計算機分析的結果,效果最好、最明顯的就是胰島素治療。後來我們發現這個過程特別像一個醫生的成長過程,一開始是讀書,能把理論框架和非黑即白的知識都把它挖掘出來。

但是,真實世界很複雜,醫療不是非黑即白的,面對一個患者的時候,往往有多種選擇,每一種選擇它都有優缺點,並不存在一個單一的「最好選擇」。每一種選擇應用到患者身上,效果也不確定,這個患者有效,那個患者無效。所以,好醫生畢業後,通過大量病例學習,臨床實踐,在自己的腦子裡邊構建了一個概率模型。他知道這個情況可以有這幾種選擇,哪種選擇有效的可能性大,這恰恰是計算機非常擅長的。

所以,我們最後做出來的這樣一個概率模型,方法就是用這種指南和臨床知識作為骨架,從數據中學習各種從疾病的篩查、診斷、治療、愈後相關的這些概率模型,把它作為血肉添加到這個骨架上,它就變成一個非常完整的臨床決策知識庫。

再給大家介紹一個例子,這是一項技術,這個技術它到底能怎麼用?我們一開始把它用到了慢性病管理領域。因為中國現在慢性病患者超過三億,包括2.6億高血壓、一億糖尿病,一億呼吸系統疾病,還有很多慢性腫瘤患者。這些患者靠的是約一百萬的社區醫生來進行管理,現狀是「管不過來」。這些醫生一年接受兩天的上課培訓,幫助他們去了解最新的治療的方案。他們一個人至少管理20種疾病,這對他們來說是一個巨大的挑戰。

我們從計算機角度能幫他做什麼?我們選擇了兩個場景,一個場景是做這種疾病的預防,我們去幫助醫生們把那些有併發症風險的高危患者儘可能地挑出來。以糖尿病為例,一個糖尿病患者可以出現超過30種併發症,如何及早發現那些還沒得中風、沒得心梗、沒腎衰竭的糖尿病患者,並讓醫生去進行一些預防。這樣既能降低病人痛苦,也能降低醫療成本。

第二塊就是治療。一個是防,一個是治,在治這個角度,我們怎麼樣利用臨床指南的知識和我們從幾十萬、上百萬的糖尿病患者治療的既往的數據中間挖掘出來的這些證據,真實世界的證據結合在一起,針對當前患者最好的治療方案。給大家看一個小的視頻,這是我們實際使用情況,可以看到目前這個系統跟醫生用的電子病例做整合。目前有6000位患者已在使用這樣的系統進行治療,每個月系統生成的推薦接近兩千,而且還在持續增長。

其實醫生接觸的新事物挺有意思的,社區的醫生一開始不願意接觸新事物,看到其中的價值之後,他們就達到了一個很高的使用的水平。我給大家也很快的看一個演示,可以看這個系統是怎麼工作的。這是在模擬社區醫生的工作的平台,醫生進行隨訪,這個系統會自動地把患者風險按高、中、低排出來。同時,會告訴醫生為什麼這個病人有風險,風險模型是什麼,這個患者有哪些數據導致他有這樣的風險,幫助醫生把這些風險因素找到,同時會做一個治療的推薦,這個病人是該降糖、降壓還是降脂,不同的治療方案,應該用什麼樣的藥物,包括劑量、頻率,所有的這些信息都是從數據里挖掘出來的。

類似的病人,他都用了一些什麼樣的治療方案,效果怎麼樣,把這樣的信息推送給醫生。這裡面就是所有的證據,比如針對某種治療,系統發現說這是指南裡面的證據,包括26%的病人,接近2300多個病人用了這個治療方案。每種治療方案的方法及效果是什麼樣的,這些信息,我們從數據中間挖掘出來,和指南知識結合在一起,推送給醫生,幫助他去做一個更好的慢性病的管理。

醫療自然語言處理可能是我今天要分享的最後一個例子了。這個裡面,它核心的技術是什麼或者它解決的問題是什麼呢?它要解決的問題就是疾病管理,我剛才也提到了,在中國慢性病患者有三億人,而高血壓的發病率大概是20%。所以,一個擁有五百萬人口的城市就有一百萬的高血壓患者,按照規定這些患者都要被隨訪管理,會有人問他最近你血壓高了沒有,降壓藥有沒有按時吃,血糖是不是也有變化,並把這些信息收集起來,然後基於這些信息來進行一個風險的評估和及時的干預。

如果發現他血壓特別高,可能醫生就會督促他進行一些血壓的管理,發現他血糖也升高了,那可能也得降點血糖。這些是靠什麼來完成的?在一個有五百萬人口的城市有一百萬的患者要去進行這樣的隨訪,怎麼可能隨訪得過來?醫生是不可能做到的,所以現在就招很多護士,包括一些提供健康管理方面的機構來培訓這些護士。但是這依然是對人工需求量很大的一個工作。所以,在這裡我想說的是,我們可以利用兩項關鍵技術來解決這個問題。

第一個技術是對話技術。我們不是做一個通用聊天機器人,而是做一個像是虛擬護士一樣的機器人。這個「虛擬護士」能夠執行「護士」的隨訪的過程,對高血壓、高血脂、高血糖病人,進行自動隨訪,並採集相應的信息,如果系統發現這個病人有情況的話,能夠生成預警。

第二個技術是QA技術,也就是問答技術。在中國有很多類似於春雨、好大夫這樣的醫患溝通網站。在這些網站上面有大量的患者在問問題,其實很多問題都與飲食、運動、作息、藥物的副作用、藥物之間不良反應有關,但這些並不是核心診斷和治療的關鍵所在,那麼,這些問題就可以靠人工來回答。同時,我們也能用QA的技術來做患者教育,幫助患者最及時地找到可信賴的信息。這塊我給大家看一個演示,就是這個系統是怎麼工作的?它的核心技術是怎樣的?這個核心技術我挑了一個應答技術這塊。

它裡面想解決的核心問題很簡單,是說你的知識庫裡面的知識或者問題往往都是寫得比較規整的,都是醫生或者是護士整理出來的,很好的。但是,患者問的問題是五花八門的,比如病名字寫錯的、藥名字寫錯的。你想大爺大媽能用什麼樣的詞?各種俚語、口語都會有。你怎麼樣去做這個QA這個核心技術?這是裡面一個非常核心的技術,所以在這裡面我們不同層級都用了深度學習的技術,包括用CNN做問題分類,做問題的相似性匹配。最後可以達到一個比較好的Top1的效果。

我給大家看一個我們在微信上做得小視頻,一個工具,這個工具,這是患者,這是機器人。他就在問,你最近長胖了嗎?最近測血糖了嗎?基本信息問完之後,它會給一個報告,一個建議說你該怎麼樣做。這個時候,患者就會有問題,我能吃什麼東西嗎?或者是說我吃這個葯有什麼問題嗎,這時候系統就會用QA的技術來自動回答問題。

它不是那種通用聊天,而是模擬一個護士在跟患者溝通。包括他會跟患者說,你最近吃什麼葯了嗎?而這個用藥的列表也是患者個性化的,因為不同的患者吃的葯不一樣。患者會回答說吃了或者沒吃,或者為什麼。經過這樣一個過程之後,系統在後台會自動地生成隨訪報告。這個隨訪報告裡面包括當次回訪採集到的體重、血壓、血糖等信息,也包括這個患者用藥的依從性、患者問的問題,通過這個報告,疾病管理師能更好地對患者進行疾病管理。同時,這個系統也具有決策功能。當它發現有風險的時候,會及時地通知患者和醫生,讓他去醫院就診或者是對患者進行及時的干預,避免釀成大禍。

時間關係,我今天的這個分享大概就這麼多了。我想最後再講一點,做醫療人工智慧是一件非常謹慎的事情。因為醫療是一個人命關天的事情,不是說你拿一個模型、演算法,給它一堆數據,一跑,就能出來一個治療或者診斷的模型。做醫療的時候,一定要把醫學的知識和靠譜的分析手段結合在一起,很謹慎地選擇數據,選擇人群,選擇你要分析的任務。此外,還要心存敬畏,這樣的話才有可能做出來靠譜、能用的醫療AI。我今天的分享就是這樣,謝謝大家!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 億歐網 的精彩文章:

娃娃魚動畫CEO潘斌:中國動畫發展急不來,市場需要用一個時代去培育
「假新聞」和「大新聞」:我們看到更可愛的影業
GMIS 2017:構建商業AI能力的五個要素
直播圈大事頻發,一把「邪火」驚動整個互聯網
世紀互聯第一季度財報公布,葉國富說實體店鋪有三座大山

TAG:億歐網 |

您可能感興趣

軍科院軍事醫學研究院科研群體:他們的故事,也是中國故事
Oxford VR和美國國立衛生研究院合作,提供VR心理精神治療
人工智慧研究院孫明俊:AI晶元評測非一日之功,需要AI企業多參與
清華人工智慧研究院院長張鈸:我與AI的關係是 「先結婚後戀愛」
清華大學國家金融研究院院長朱民:人工智慧是科技的最終未來
奎罡國學研究院
每經記者專訪中國貿促會研究院國際貿易研究部主任趙萍:美方若濫用貿易保護主義 中國有足夠多的反制手段
美國立健康研究院聲明:賀建奎違反國際常規
中國非洲研究院成立大會暨中非合作與人文交流學術研討會召開
清華人工智慧研究院成立基礎理論研究中心,朱軍擔任主任,深耕「第三代」AI 演算法
前ABB德國研究院首席科學家丁昊博士-工業機器人協作應用及挑戰
一物一故事丨中國教育科學研究院朝陽實驗學校米濤:司母戊鼎
發展第三代人工智慧:清華AI研究院基礎理論研究中心成立,朱軍任主任
中日韓三國重啟合作勢頭——專訪中國現代國際關係研究院研究員劉軍紅
中國人民公安大學與中國信息通信研究院聯合倡議成立「智慧警務創新應用實驗室」,推動人工智慧與公安業務創新應用
前ABB德國研究院首席研究員丁昊博士分享工業機器人協作應用及挑戰
三星欲設無人車晶元部門、中國海洋大學與韓國機器人融合研究院簽署合作備忘錄、Brain Corp將為沃爾瑪提供人工智慧服務等
清華大學人工智慧研究院成立基礎理論研究中心,朱軍教授任中心主任
美國國家衛生研究院用VR幫助同性戀向伴侶坦白HIV狀況
清華大學人工智慧研究院十大中心之視覺智能研究中心成立