當人工智慧進軍醫療領域:你是否敢把自己交給機器人醫生?
按:在百度搜索引擎中輸入關鍵詞「大數據醫療」,彈出的第一條結果就是IBM公司的認知型醫療項目,這個項目基於一款名為「沃森」的問答計算機系統(question answering computer system)。「沃森」的名頭可能不如「AlphaGo」響亮,但它成名卻比「AlphaGo」早,早在2011年,它就在美國著名的智力競賽節目《危險邊緣》(Jeopardy!)上以壓倒性優勢戰勝了人類總冠軍肯·詹寧斯。賽後,詹寧斯表示:「智力競賽節目可能是因思維型計算機的出現而變得多餘的第一個領域,並且我確定,它不會是最後一個。」
詹寧斯所言不虛,「沃森」因《危險邊緣》一舉成名後,IMB立刻宣布,它的下一個目標是進軍醫療行業。2013年,「沃森」先是在紐約斯隆·凱特靈紀念癌症中心被應用於肺癌治療,後來又與美國著名的安德森癌症中心達成合作關係。然而據《福布斯》雜誌報道,這項合作已於2017年停擺,經過了四年間數次研究重點的更迭,花掉了6200萬美金的巨額經費之後,「機器人看病」的美好願景還是無疾而終。
但在美國矽谷的科技大佬及其背後的風險投資人看來,「機器人看病」只是一個時間問題。隨著計算機運算能力的不斷增強、病歷記錄的逐步數字化,再加上科技創新呈現出越來越強的跨領域「交叉融合」的特點,人工智慧在醫療領域的應用終將柳暗花明。甚至有人預測,到2025年,數據驅動的自動化醫療機構將會取代醫生80%的診斷和治療工作。
這一數字激怒了不少醫生,卻沒有人敢理直氣壯地否定它。畢竟在十年之前,人們對於自動駕駛技術也曾抱有類似的質疑態度,在人們的想像中,太多場景是機器無法處理的:當一個小孩子追著足球橫穿馬路,當一個發著簡訊的年輕人出人意料地忽然轉向,當信號燈出現了故障,甚至是一個日常駕駛中平淡無奇的場景——在迎面而來的滾滾車流中左轉彎——都足以讓機器不知所措。然而,在十年後,數據告訴人們,機器不僅能夠嫻熟地應對這些複雜路況,並且它犯的錯誤比人類司機要少得多。
我們可以將駕駛汽車、回答問題甚至下圍棋,與醫學診斷和治療相提並論嗎?醫生的工作到底特殊在哪裡?這是今年一月出版的新書《數字醫療:信息化時代醫療改革的機遇與挑戰》想要回答的問題之一。這本書的作者是美國加州大學舊金山分校醫院院長羅伯特·瓦赫特,他是「醫院醫生」(hospitalist)概念的提出者,曾獲得美國患者安全領域最高榮譽「約翰·艾森伯格獎」,並連續十年被《現代醫療》雜誌評為「全美50位最具影響力的醫生高管」。除此之外,他還是六本醫療領域暢銷書的作者,他的個人網站也是最受美國人喜愛的醫療博客之一。然而這本書所呈現的,卻不只是他的個人意見,而是他對數字醫療相關領域的100餘位代表人物的採訪,這些對話還原了美國近15年來的數字醫療發展史。
在這15年時間裡,歷經兩屆美國總統,藉由300億美元撥款和相關法律的出台,美國經歷了醫療數字化的重要變革,但這一變革僅僅是為更大的顛覆性革命鋪就了基礎設施,即實現了整個醫療衛生服務體系的數字化,以及不同醫療信息系統之間的初步互聯,這些基礎設施的完善為人工智慧參與診斷和治療提供了可能性。
但即便最堅定的技術樂觀主義者也無法否認,技術革命並不能從根本上解決醫療行業根深蒂固的矛盾和問題,甚至在某種程度上,這些矛盾在技術的催化之下顯得更加嚴峻和急迫。醫療行業固有的公益性與盈利性、開放性與私密性、科學性與人文性、壟斷與創新等矛盾,也淋漓盡致地體現在醫療數字化的整個過程之中,因此,這本書不僅是從專業角度對數字醫療可行性的探討,更是對它可能帶來的風險和倫理困境做出的一番人文層面的反思。經出版社授權,界面文化(ID:booksandfun)節選了《數字醫療》一書中關於人工智慧參與醫療決策的部分章節,以饗讀者。
《數字醫療:信息化時代醫療改革的機遇與挑戰》(節選)
文 |[美]羅比特·瓦赫特 譯 | 鄭傑
一、緩慢積累、迅速爆發
安德魯 ·麥卡菲作為暢銷書《第二次機器革命》(The Second Machine Age)的共同作者,他贊同科斯拉的觀點,認為機器最終將會從醫生手中接管包括診斷在內所有的一切 。麥卡菲自稱是一個「技術樂觀主義者」,我們在麻省理工學院附近共進午餐時,他告訴我:「我不認為有什麼能阻擋這一發展。」麥卡菲認為,隨著機器計算能力的不斷增長,互聯網上大容量的數據觸手可及,再加上創新所具有的「交叉融合特點」,所有這些組合起來意味著,類似「人工智慧在醫療領域裡的應用」這種曾經看來死路一條的問題將柳暗花明。他們引用海明威對一個人破產的描述來比喻數據壁壘倒塌的速度:緩慢積累,迅速爆發。
在與麥卡菲的交談中,我感到一種莫名的想要捍衛人類和醫生權利的責任感。我告訴麥卡菲,雖然我對無人駕駛汽車和IBM的超級計算機在國際象棋比賽和《危險邊緣》節目中取得的勝利懷有敬畏之心,但一般人可能並不清楚醫學的複雜性。一方面,不確定性在診斷中是經常出現的,因而回答「正確」通常是一個令人吃驚的概率問題。此外,許多疾病需要一段時間之後才能確診。例如,病人可能說他頭痛,但是並不嚴重。這時首選治療措施是安撫病人、泰諾和時間。如果在接下來的兩個星期里,患者頭痛逐漸加重,尤其是還出現諸如乏力、噁心等新的癥狀,那麼這時的診斷將會完全不同。
麥卡菲肯定不止一次曾聽到「你不懂,我的工作和你想的不一樣」這種觀點,他會表示贊同,然後說:「你們描述這些情況的時候,我猜IBM肯定有一堆聰明的程序員已經記錄了這些。在他們的腦袋裡想的是『面對這種情況,我該如何建模?』」
當我和維諾德 ·科斯拉(矽谷著名風險投資人)在門羅帕克( Menlo Park)第二次見面的時候,我勇敢地嘗試了另外一種方法。我說:「維諾德,醫學中有一種檢查叫作』目測』,這意味著我能夠分辨出身體指標相似的兩個病人。比如說,體溫值、心率值、血細胞計數類似的兩個人。我的經驗使我能夠判斷『這個人有問題,而另外一個人是健康的』。」我告訴他,一個經驗豐富的醫生通常都能做出正確的判斷,因為在既往大量的訓練、眾多病人和成千上萬的試驗和錯誤中,醫生們獲得了某種第六感可幫助做出正確的判斷。
但科斯拉並沒有動搖。「問題在於』這些信息是無法定量的還是沒有被定量』,」他回答,「此外,直覺在哪些情況下起作用,哪些情況下會失效呢。我認為,如果你進行更嚴謹的研究,就會發現『目測』的作用比你想像中小得多。」
人類與機器的爭論早已不再新鮮,這些爭論的結果通常以「共存」而非「取代」而告終。在一些領域中,當計算機和人共同協作、充分發揮人機的互補優勢之時才能得出最優的結果。在醫療領域,這些爭論通常很有意思並且非常激烈,主要是因為變革的風險較高、人體機能具有複雜性,以及醫學不僅需要診斷治療的技術、藥物,還需要考慮道德、倫理問題。而在人工智慧的其他應用領域,例如計算機自動選擇酒店房間、自動選股或者讓無人駕駛汽車選擇左轉彎的時機,就不會存在後面這些問題了。
為了使人工智慧在醫療領域找到一席之地,人們已經耕耘探索了50多年,當然,整個過程並非一帆風順。即使是致力於用計算機取代醫生的諸多技術狂人也承認它被過度吹捧了,並且其應用場景有限,恐怕僅僅是為醫生在臨床中提供決策建議也難以做到。
時代在進步,逐漸普及的電子健康檔案為人工智慧系統和形成大數據提供了在紙質化時代難以想像的材料。而在當今有了沃森的時代里,我們又有了新的應用技術,比如自然語言處理和機器學習。或許這就是「緩慢積累、迅速爆發」的時刻。
二、計算機能夠習得醫生的診斷思維嗎?
在醫療領域,大眾關注的目光總是集中在一些知名專家身上,卻很難留意到這麼一群人:了不起的診斷學醫生。在其他醫生被人們所熟知的時候,他們卻默默無聞。他們具有一種能夠從一團混沌的癥狀、體征和實驗室檢查數據中抽絲剝繭地得到真相的非凡能力。實際上,英國著名作家阿瑟 ·柯南 ·道爾爵士也曾經是一名受過醫學訓練的醫生,他正是以自己的教授,即當時愛丁堡醫學院知名的診斷學專家約瑟夫 ·貝爾( Joseph Bell)為原型創作了夏洛克 ·福爾摩斯這個角色。
對於眾多醫生而言,診斷學構成了他們臨床實踐的本質,成為他們專業的靈魂,也許正是因為這個原因,我們很難相信電子晶元能夠替代專業臨床技能。
20世紀70年代,塔夫茨大學腎臟病專家,也即後來擔任《新英格蘭醫學雜誌》編輯的傑爾姆 ·卡西勒( Jerome Kassirer)決心要破譯著名診斷學專家面對疾病時的認知模式。如果他成功了將會帶來巨大的回報:這種富有洞察力、以解決問題為導向的策略和醫學巨匠的思維模式將有可能直接傳授給其他醫生,並有可能用計算機語言編程。
卡西勒最初著眼於鑒別診斷,也就是那些醫生長久以來根據患者的臨床特徵進行整理歸納、分類的方法。在診斷過程中包含著大量臨床技能和諸多藝術思維的應用。例如,我們需要明確病人的癥狀是由於單一疾病引起的,還是說由兩種或多種不同疾病引起的。奧卡姆剃刀定律告訴我們,應該尋找到能夠解釋病人所有癥狀的最簡約診斷。雖然醫學生謹記這個簡明的臨床法則,但是我們還需要權衡與其對立的希卡姆判詞( Hickam』s Dictum),後者代表的是「病人當然有可能會同時患有多種疾病」。
研究人員發現,其實醫生從事的是一種「重複性假設檢驗」的工作,在這一過程中將鑒別診斷轉化為確切的信息,因為病人經常有眾多異常表現需要解釋。醫生在了解病例最初的信息後,就開始嘗試用可能的原因去解釋這種情況,同時隨著病情的發展、收集到更多的信息後完善他們的診斷。
病人給出的每一次回答和體格檢查,無論檢查出是陰性還是陽性的體征都是一次對篩查診斷自動直觀的校準。我在工作中觀察同行業著名專家時發現,關於加州大學舊金山分校的吉爾普里特 ·達利瓦( Gurpreet Dhaliwal)在2012年的《紐約時報》上曾有一篇報道,說的是當醫生詢問病人一系列看似無關病人主訴的問題時,實際上是在逐漸「縮小鑒別診斷範圍」。
然而,診斷學是有更大的玄機的,這也是認知的魔法。資深的專家會敏銳地注意到一些信息,比如病人去年曾去泰國鄉村旅遊,而拋棄其他重要的信息,比如3周前出現腹痛、腹脹。由於初學者欠缺基本的知識體系去釐清,為什麼他們的老師會著重於某個零碎的信息而無視初學者看來同樣重要的其他信息,這是臨床診斷學最令他們迷惑的地方,對於計算機而言,理解這些更是天方夜譚。
除此之外,對電子健康檔案進行語法分析也是巨大的挑戰。自然語言處理已經取得了長足的進步,但它仍然存在一些否定詞和家族史的問題,比如「病人否認既往有胸痛或咳嗽」或不了解「患者的姐妹有關節炎,但母親體健」,以及無法對一些癥狀體征進行命名。某些特定術語具有不同的含義,比如「 depression」對於心理醫生而言通常是一種情緒上的異常,而對心內科醫生而言,在心電圖檢查中則是「沒有證據表明 ST段壓低」的意思。此外還有縮寫的問題,比如對患有 MS的病人,這個「 MS」究竟是什麼意思,是多發性硬化還是瓣膜粘連的二尖瓣狹窄呢?最後還有一個問題,雖然眾多工程師正在解決這個問題,但計算機並不能識別病人音調的變化和面部的緊張焦慮。「我胸痛」和「我胸很痛」為診斷帶來的意思完全不同。
人工智慧系統最需要學習、獲取的恰恰是其複雜的認知過程,至少對現在來說,這可能是最難處理的問題了。讓我們回到先前主動脈夾層這個病例,主動脈夾層是發生在主動脈血管壁上的撕裂,如果不及時處理後果通常是致命的。如果最開始有考慮主動脈夾層可能性的病史,哪怕是最微小的可能性,我也會詢問病人疼痛是否會放射至後背部,並仔細聽診主動脈瓣關閉不全引起的輕微雜音,以及雙上臂血壓不對稱的異常情況,所有的這些線索通通都指向主動脈夾層。如果不考慮這個嚴重且少見的疾病的話,我不會故意尋找這些線索,這些不是常規查體中的一部分。
幾十年前,早期與卡西勒及其同事合作過的麻省理工學院人工智慧專家彼得 ·施羅維茨( Peter Szolovits)就已經認為,把診斷學當成簡單的醫患問答是不可行的。這主要是因為他考慮到了時間的重要作用,「5年前和 5分鐘前的心肌梗死具有迥然不同的意義。」他解釋說,而計算機並不會「理解」這些信息,除非工程師針對這些信息進行處理。對於我們來說,基本的知識對人工智慧來說也是基本的信息,但計算機並不「理解」我們日常生活中用到的一些基本假設,比如液體是濕漉漉的、愛情是美好的、死亡是永恆的。
此外,許多醫學推論依賴於反饋:通過觀察事件進展過程,利用獲取的信息修正可能的診斷。我們認為病人可能有細菌性肺炎,因而給予抗生素治療「肺炎」,但病人在 3天後體溫仍未下降。這時候我們會考慮結核或者狼瘡的可能性。這是臨床醫生對患者的認知過程,相對於「診斷是什麼」更應重視「我應該如何處理病人」。一個無法理解這一過程的人工智慧程序,其應用價值必將受到限制。
三、轉變範式,向醫生取經
診斷學不僅令人興奮,它還是醫療安全的核心。人們常常會出現診斷錯誤,並帶來嚴重後果。大量的屍檢研究表明,過去40年來有近20%的病人的主要診斷存在疏忽。隨著CT掃描和功能性磁共振成像的出現,這個數字有所下降,但仍然維持在10%左右。僅美國而言,診斷錯誤造成的死亡人數每年就達40,000 ~ 80,000人。對醫療事故案件的回顧表明,診斷錯誤是導致醫療訴訟最常見的原因。
20世紀70年代,醫療信息技術專家開始陷入無休止的爭論:能否設計出一系列的計算機程序幫助醫生更好地診斷病人,或者完全替代醫生。那個時期的學術文章充滿了積極的觀點:微處理器通過編程便能像專家一樣思考,它很快就會替代繁忙的醫生。1971年,一個早期計算機先行者受到了這種觀點的影響,並寫下來對它的讚歌:「它不會感到勞累,也不會粗心大意;它總是在不停地工作著,從白天到黑夜,從周末到假期,不需要咖啡、休息、加班,也不需要額外的津貼和美言贊語。」
到了20世紀80年代中期,悲觀情緒開始蔓延。10年前看似充滿希望的種種工具似乎都無法駕馭臨床醫學的複雜度,這些工具也沒有取得醫生群體的認可,商業前景黯淡。醫學方面的人工智慧發展近乎停滯,這標誌著為期20年、被業內人士稱為「人工智慧寒冬」的開始。在該領域工作多年的特德 ·肖特利弗(Ted Shortliffe)曾說:以INTERNIST、DXplain和 MYCIN等軟體為代表的早期成果使他想起了一個卡通場景,即一名醫生正在診察一個面露痛苦的病人,從這個病人背後插著的羽箭能夠看出來這是一名射箭運動員。而後醫生回到辦公室站在計算機前,看了眼屏幕,之後叫:「心率加快、出汗、呼吸淺……根據計算機診斷,你可能得了膽結石。」
讓我們回顧一下過去,早期人工智慧程序的一個問題是,它們試圖像醫生一樣思考,編寫成千上萬條小規則並加以判斷。例如,「如果尿液試紙紅細胞檢測呈陽性,那麼有可能是腎臟或者膀胱出現了疾患,但如果顯微鏡檢查沒有發現紅細胞,那有可能是肌紅蛋白尿,進而檢查肌酸激酶水平」。這種模式很快就被證明站不住腳,就如你在奧卡姆剃刀定律和希卡姆的判詞中了解的一樣,我們的準則有時候會互相衝突,這時就需要人的判斷了。
當IBM公司宣布,沃森在參加完《危險邊緣》節目後將會進軍醫療衛生行業,媒體立即開始炒作人類與超級計算機對抗的主題,但IBM的醫療戰略執行官邁克爾 ·韋納(Michael Weiner)卻表示:「當然,有人會說『看吧,計算機在一次智力競賽中戰勝了人類』,但我認為重點不是人機競賽的結果,我認為真正的重點是人和機器可以在醫療領域協作解決一些問題。我認為這將會對所有人產生深遠影響。」
針對此問題,我們曾採訪過5位來自IBM的醫生和工程師,他們都持有相似的觀點。至於其原因,我猜想這裡可能存在部分歷史因素、商業原因、法律限制以及技術問題。
歷史因素是: IBM公司非常了解醫療人工智慧產品承諾太多卻無法實現的歷史,所以不想進入另一個炒作周期;商業原因是:IBM公司將產品的銷售目標瞄準了那些由醫生組成的或者是由醫生運營的組織機構,而將待銷售商品與客戶進行較量通常會是個糟糕的營銷策略;法律限制是:如果沃森僅僅只是一個工具、一個醫生助手,當出現問題時,它可以因其「免責協議」規避責任;技術問題在於:似乎沃森的開發團隊都體會到了醫療診斷的複雜性。到目前為止,即便 IBM公司的最終目標是讓醫療人工智慧替代醫生,工程師們仍舊需要醫生來教他們如何做到這一點,它需要與醫生互動並且成為他們所在生態系統的一部分。
來源:
原創
界面新聞


TAG:新沂市互聯網產業園 |