當前位置:
首頁 > 知識 > 機器人都能看病了,還需要職業醫生嗎?看完這篇就明白了

機器人都能看病了,還需要職業醫生嗎?看完這篇就明白了



機器人都能看病了,還需要職業醫生嗎?看完這篇就明白了



【AI世代編者按】《紐約客》雜誌日前撰文,通過具體事例闡述了人工智慧可能在醫學領域發揮的作用,甚至有望在一定程度上代替皮膚科醫生和放射科醫生。


以下為AI世代(微信號:tencentai)編譯整理的原文內容:


去年11月的一天晚上,一位54歲的女士感覺頭痛難忍,於是從布朗克斯來到哥倫比亞大學醫學中心的急診室就診。她對醫生說,她的視力有些模糊,左臂感到麻木無力。醫生給她做了檢查,還讓她做了一個頭部CT掃描,


機器人都能看病了,還需要職業醫生嗎?看完這篇就明白了



幾個月後,也就是今年1月的一天早晨,一支由4位正在接受培訓的放射科醫生組成的團隊坐在這所醫院三樓的一台電腦前面。那個房間沒有窗戶,光線很暗,只有電腦屏幕閃著微光,就像被海水過濾了一樣。住院醫生們擠在一個隔間里,哥倫比亞大學神經放射學主任安吉拉·里格尼利-狄普爾(Angela Lignelli-Dipple)站在後面拿著紙筆。她正在訓練他們閱讀CT片子。


「一旦大腦死亡變灰,就很容易診斷中風。」她說,「真正困難的在於,如何在過多的神經細胞開始死亡之前進行診斷。」 中風通常是由堵塞或出血引起的,放射學家大約有45分鐘的時間作出診斷,只有這樣,醫生才有可能介入治療——例如,清除正在長大的凝塊。「把你自己想像成急診室醫生,」里格尼利-狄普爾接著嚴肅地說道,「每過一分鐘,大腦就有一部分死亡。時間流逝越多,大腦死亡得就越多。」


她看了一眼牆上滴答作響的鐘錶。「看出哪有問題了嗎?」她問道。


中風通常都是非對稱性。血液供給到大腦後分成左右兩路,然後在兩側延伸出許多支流。凝塊或出血往往只會影響其中的一路,導致大腦一側受到影響。隨著神經細胞失去血液供給,並逐漸死亡,解剖結構會變得模糊。最終,組織會收縮,留下一片乾癟的陰影。但在中風之後,那片陰影通常只能在掃描結果上停留幾小時或幾天,之後便會錯過介入時機。「在那之前,」里格尼利-狄普爾對我說,「掃描片上只有一點線索」——這正是中風的前兆。


那位布朗克斯女士的掃描片從頭骨底部一直縱切到頂部,就像從下往上切開一個西瓜。住院醫生們爭相查看一層層的掃描圖片,就像快速翻閱書籍一樣,嘴裡不斷冒出各種解剖結構名詞:小腦、海馬體、島葉皮質、紋狀體、胼胝體、心室。後來,一位不到30歲的男住院醫生在一張片子前停了下來,把鉛筆尖移到大腦右側的邊緣。「這裡有點不協調。」他說,「邊緣看起來很模糊。」 在我看來,整張片子都不協調,也很模糊——完全是像素一樣的效果——但他顯然看出了不同尋常的地方。


「模糊?」里格尼利-狄普爾戳了戳那裡,「你能再詳細描述一下嗎?」


那位住院醫生吞吞吐吐地說出幾個字,然後停了一下,好像在腦海里仔細查找解剖結構,衡量各種可能性。「就是不太一樣。」他聳了聳肩,「我也不知道為什麼,就是覺得看起來不對勁。」


里格尼利-狄普爾又拿出20小時後拍的第二張CT掃描片。那位住院醫生說的沒錯,就在那個位置出現了一片直徑跟葡萄差不多大腫脹區域。之後幾天拍攝的一系列掃描片揭開了故事的剩餘內容。那位女士的大腦出現了明顯的楔形灰色區域。

就在那為女士來到急診科後不久,神經科醫生就試圖用藥物疏通她堵塞的血管,但她來得太晚了。第一次掃描結束後幾小時,她就失去了意識,被送進ICU(重症監護室)。兩個月後,那位女士仍然住在樓上的病房裡,從胳膊到腿,她的整個左側肢體都癱瘓了。


我跟著里格尼利-狄普爾走到她的辦公室。我是來這裡了解學習過程的,包括醫生如何學習給人看病?機器學習能否給人看病?


診療的奧秘


我本人開始接觸診療流程是從1997年秋天開始的,我當時在波士頓實習。為了做足準備,我看了一本經典的醫學教科書,它把診療活動分成4個階段:第一,醫生藉助病人的病歷和身體檢查來收集關於其病情的信息。第二,將這些信息進行整理,製作成一份潛在疾病的完整列表。然後通過問題和初步檢查幫助其加強一些假設,同時排除其他假設——這就是所謂的「鑒別診斷」。同時還要考慮某種疾病發生的概率,並參考病人的病史和風險狀況。此時的列表就會收窄,由醫生進提煉自己的評估結果。最後一步就是決定性的實驗室檢測,利用X光或CT掃描來證實自己的假設,結束診斷。


數十年來,與之類似的診療流程在醫學教科書中不斷重複,一代又一代的醫科學生的腦海里都植入了類似的規則。


但我很快發現,真正的診斷藝術並非如此簡單。我在醫學院的指導醫師是個優雅的新英格蘭人,他的皮鞋擦得鋥亮,口音也很明顯。他為自己是一名診斷專家而自豪不已。他首先會讓自己的病人展示一下癥狀——就拿咳嗽為例——然後靠在椅子上,說出幾個形容詞。他可能說「刺耳而尖細」,也可能說「低沉而發顫」,彷彿是在品嘗紅酒。在我看來,所有的咳嗽聽起來幾乎都一樣,但我還是會隨聲附和,「沒錯,刺耳」——就像在冒充行家品嘗紅酒一樣。


那位擅長對咳嗽分門別類的醫生很快就會縮小診斷範圍。他可能會說,「聽起來像肺炎。」也可能說:「似乎有充血性心力衰竭的羅音。」 他之後會詢問很多問題。例如,病人最近是否體重增加?有沒有暴露在石棉環境中?他還會讓病人再咳嗽幾次,然後用聽診器仔細傾聽。根據具體的結果,他可能會給出另外幾種可能,感覺就像在加強或削弱之前的假設。之後,他會像路邊變戲法的一樣給出自己的診斷——「心力衰竭!」——然後要求病人通過檢查來確定診斷是否正確。通常情況下,他的診斷都準確無誤。


幾年前, 巴西的研究人員對放射科醫生的大腦進行研究,希望了解他們是如何得出診斷結論。這些經驗豐富的診斷專家是否會利用思維里的「規則手冊」來判斷圖像,還是藉助「模式識別或非分析性推理?」


他們讓25名放射科醫生評估一些肺部X光片,同時利用磁共振追蹤他們的大腦活動。(這其中產生了一個絕妙的遞歸:診斷診斷過程,給拍片醫生拍片。)X光片呈現在他們面前,其中一組包含常見的病變——可能是手掌形的肺炎陰影,也可能是肺內層的累積的不透明液體。第二組診療圖片則是動物輪廓,第三組是字母輪廓。


放射科醫生會隨機看到這三種圖片,然後儘快判斷病變、動物或字母名稱,同時用核磁共振儀追蹤他們的大腦活動。放射科醫生平均需要1.33秒得出診斷結論。在全部3種情況下,大腦點亮的區域都完全相同:一片是靠近左耳的神經元三角區,另一片是顱骨後底上方的一片蛾形帶狀區。

「我們的研究結果支持了一種假設:當醫生迅速識別一種特徵或病變時,過程與識別日常生活中的東西相同。」研究人員總結道。識別損傷的過程與識別動物相同。當你識別犀牛時,並不會考慮和排除其他動物,不會在內心把獨角獸、犰狳和小象融為一體。你是把犀牛作為一個整體來識別,也就是一種模式。放射科醫生同樣如此。他們沒有思考、回憶和區分的過程,只是看到了普通的物體。我的指導醫生同樣如此,在他看來,辨別那些羅音就像在聽自己熟悉的叮噹聲。


知其然,還要知其所以然


1945年,英國心理學家基爾伯特·賴爾(Gilbert Ryle)針對兩種知識發表了一場影響深遠的報告。一個孩子知道自行車有兩個輪,知道輪胎里充滿空氣,也知道可以通過一圈圈地踩踏踏板來推動這個奇妙的裝置前進。賴爾將這種關於事實的命題性知識稱作「知其然」(knowing that)。但要學會騎自行車,則需要掌握另外一些知識。孩子需要通過摔跤、保持兩輪平衡和反覆穿過坑窪來學會騎車。賴爾將這種通過經驗獲得的隱晦的技能性知識稱作「知其所以然」(knowing how)。


這兩種知識似乎相互依賴:你可能會使用事實性知識加深經驗性知識,反之亦然。但賴爾警告稱,不應把「知其所以然」簡化成「知其然」——兒童不可能通過看書學會騎自行車。他宣稱,我們的使用為規則賦予了意義。「規則就像小鳥,必須在先活下來才能被餵飽。」


一天下午,我看到我7歲的女兒準備騎自行車穿過一個小山坡。她第一次在坡度最陡的地方停下來摔倒。第二次則俯身向前,一開始幅度很小,後來越來越明顯,然後隨著坡度的減小把重心後移。但我並沒有教給她騎車穿過山坡的規則。我猜,當她的女兒學習爬坡時,她也不會向其傳授規則。我們只會向後代傳遞關於宇宙的一般規則,剩餘的部分都交給大腦來解決。


在里格尼利-狄普爾給放射科醫生上的那堂培訓課結束後,我跟斯蒂芬·海德(Steffen Haider)聊了一次,他就是那個通過CT掃描片看出早期中風跡象的年輕人。他是怎麼找出早期損傷的?這究竟是「知其然」還是「知其所以然」?他一開始跟我說了一些自己學習的規則。他知道中風往往位於一側,會導致組織出現輕微「灰化」;組織往往還會出現輕微腫脹,導致解剖學邊界消失。「大腦里有些地方的供血很容易出問題。」他說。為了找到損傷,他必須在大腦兩側不對稱的地方搜索這些信號。


我提醒道,他當時查看的掃描圖像中有很多被他忽略的不對稱之處。與多數掃描片一樣,那些片子也在左側顯示出一些右側沒有的灰色曲線——可能是人體運動造成的,可能是偶然,也有可能是那位婦女中風的前兆。他是如何將重點縮小到那片區域的?他停頓了一下,認真思考了一會兒說:「我不知道——應該跟潛意識有關。」他最終說道。


「作為放射科醫生,在你成長和學習的過程中,就形成這種潛意識。」里格尼利-狄普爾對我說。問題在於,機器能否以同樣的方式「成長和學習」。


AI大咖特龍出手



機器人都能看病了,還需要職業醫生嗎?看完這篇就明白了


2015年1月,計算機學家塞巴斯蒂安·特龍(Sebastian Thrun)被醫療診斷難題深深吸引。特龍在德國長大,身材消瘦,留著光頭,給人一種風趣幽默的感覺,有點像米歇爾·福柯(Michel Foucault)和憨豆先生的合體。他原先是斯坦福大學的教授,負責該校的人工智慧實驗室,後來離職創辦了Google X,領導自學機器人和無人駕駛汽車項目。但他發現自己擁有學習能力的醫療設備很感興趣。他的母親49歲時死於乳腺癌——這種是特龍現在的年紀。


「多數癌症患者起初都沒有癥狀。」他對我說,「我母親也沒有。等到她去看醫生時,癌細胞已經轉移。我真希望能在早期檢查出癌細胞——那時還可以用手術刀將其切除。於是我一直在思考,機器學習演算法能否幫上忙?」


自動診斷方面的早期嘗試通常與教科書里的顯性知識密切關聯。以心電圖為例,它可以將心臟的電活動以線條形式體現在紙張或屏幕上。過去20年,計算機解讀往往會成為這些系統的一項功能。能夠從事這項工作的程序往往非常直接,將特徵波形與多種情況關聯起來——心房顫動或血管堵塞——並將識別這些波形的規則輸入系統。當機器識別出模式後,便可將符合條件的心跳標記為「心房顫動」。


在乳房X光成像領域,「計算機輔助診斷」同樣也很常見。模式識別軟體負責標記可疑區域,然後由放射科醫生進行複查。但識別軟體往往會使用基於規則的系統來識別可疑病變。這些程序沒有內在的學習機制:看過300張X光片的機器並不比只看過4張X光片的機器更聰明。


2007年的一項研究凸顯了這一問題,當時的研究將實施計算機輔助技術前後的乳房X光成像的準確度進行了對比。有人或許認為,部署這項技術後的診斷準確性會大幅提升。但實際上,這些設備的影響很複雜。在計算機輔助診斷組的活體檢查準確率上升,但腫瘤學家最希望檢測到的小型浸潤性乳腺癌準確率卻有所降低。(後來的研究甚至發現存在假陽性問題。)


特倫相信,只要放棄基於規則的演算法,轉而使用基於學習的演算法,便可超越第一代診斷設備。換句話說,就是將機器診斷方式從「知其然」變成「知其所以然」。逐漸地,特龍開發的學習演算法開始使用「神經網路」這種計算策略——之所以叫神經網路,是因為它的靈感來自於大腦的模型。在大腦中,神經突觸會通過反覆的活動進行強化和弱化。這些數字系統希望通過數學模式來完成類似的目的,通過調整連接的「權重」來達到理想的輸出結果。更強大的系統還擁有類似於神經的演算法,每一層都會處理輸入的數據,然後將結果發送給下一個層。因此就形成了「深度學習」。


特龍首先從皮膚癌開始,具體來說就是角化細胞癌(這是美國最常見的一種癌症)和黑色素瘤(皮膚癌中最危險的一種)。機器能否學會通過掃描圖像將皮膚癌與良性的皮膚問題————痤瘡、皮疹或胎記——區分開來?「如果皮膚科醫生能夠做到,那麼機器應該也能做好。」特龍推測道,「機器甚至可能做得更好。」


以往,與其他醫科學生一樣,皮膚病學關於黑色素瘤的教學都是從一套便於記憶的規則開始:黑色素瘤通常不對稱(asymmetrical,簡稱A);邊緣(border,簡稱B)不均勻;顏色(color,簡稱C)不一致且有雜色;直徑(diameter,簡稱D)往往大於6毫米。但當特龍從醫學教科書和網上查找黑色素瘤的樣本時,卻發現這些規則在某些情況下完全不適用。


特龍仍在斯坦福大學擔任兼職教授,所以他找了兩名學生幫助他開展研究,他們分別是安德烈·艾斯特瓦(Andre Esteva)和布雷特·庫普利爾(Brett Kuprel)。他們的第一項任務就是開發所謂的「教學計劃」:這其實是一組用於教給機器識別惡性腫瘤的龐大圖形庫。

艾斯特瓦和庫普利爾在網上搜索後發現了18個由皮膚科醫生分類的皮膚病變圖形庫。其中,總共約有13萬張關於痤瘡、皮疹、蟲咬、過敏反應和癌症的圖片,都被分門別類歸入近2000種疾病。值得注意的是,還有2000個病變的數據集已經由病理學家進行過活體檢查,因而基本可以確診。


艾斯特瓦和庫普利爾開始對系統進行訓練。他們並沒有編製任何規則,也沒有教給系統任何「ABCD」。相反,他們只是向神經網路展示圖片和診斷歸類。我向特龍請教了這種網路的工作模式。


「試想,如果讓一個傳統程序去識別一隻狗,」他說,「軟體工程師需要寫1000個『if-then-else』語句:if有耳朵,有鼻子,有毛髮,而且不是老鼠……諸如此類,不勝枚舉。但小孩肯定不是這麼認識狗這種動物的。他們起初會通過觀察狗來學習,然後大人會告訴他們這就是狗。他們可能會犯錯,但卻會自我糾正。他們可能把狼錯當成狗——但大人會告訴他們這其實是兩種不同的動物。所以他們會逐步改變自己的認知:這是狗,那是狼。機器學習演算法就像小孩一樣從訓練集中提取經過歸類的信息。這是狗,那不是狗。它之後便可從一個數據集中提取特徵。針對成千上萬種經過歸類的圖片進行自測後,便可形成自己識別狗的方式——這同樣跟小孩一樣。」這樣一來,它就能「知其所以然」。


2015年6月,特龍的團隊開始通過一個「驗證集」(已經由皮膚科醫生診斷過的1.4萬張圖片,但未必進行過活體檢測)測試機器的「本領」。這套系統能否把圖像正確歸類為良性病變、惡性病變和非癌性生長?系統的準確率達到72%。(該系統的輸出結果並不是簡單的「是」或「否」,而是給出某種病變可能屬於某種類別的概率。)而兩位同步接受測試的執業皮膚科醫生表現略差:他們的正確率只有66%。


特龍、艾斯特瓦、庫普利爾之後擴大了研究範圍,納入了25位皮膚科醫生,而且使用了一套黃金標準測試集:其中大約包含2000張經過活體檢測的圖像。幾乎在每次測試中,機器都比醫生更加敏感:它忽略黑色素瘤的概率更低。機器也比人更加明確:它把其他東西誤診為黑色素瘤的概率更低。「在每次測試中,神經網路的表現都超過專業皮膚病醫生。」該團隊在《自然》雜誌上發表的論文中寫道。


「關於這套神經網路,還有一件十分重要的事情沒有在論文中完全體現出來。」特龍對我說。他和他的團隊最早使用的是一套完全「白紙一張」的神經網路。但他們發現,如果提前對神經網路進行訓練,使之可以識別一些不相關的特徵(例如,區分出貓和狗),便可實現更快、更好的效果。或許我們的大腦也採用類似的工作模式。因式分解、同源動詞、元素周期表那些在高中時接受的各種練習雖然讓人感覺思維麻木,但實際效果可能恰恰相反:它能讓我們的思維更加敏銳。


在教育機器時,該團隊必須小心處理圖像。特龍希望人們有朝一日只需要用智能手機拍下自己擔心的病變圖片,即可完成診斷。這就意味著系統需要適應多變的角度和光線環境。但他回憶道,「在某些情況下,黑色素瘤已經被黃圈標記過。我們必須將其裁剪出來——否則電腦可能會把黃圈當成癌症的標記。」


這是個古老的難題:一個世紀前,德國公眾被Clever Hans迷住了,據說那匹馬懂得加減法,而且能夠通過敲擊馬蹄給出答案。但實際上,Clever Hans只是感受了馴馬師的舉止。當馬蹄聲接近正確答案時,馴馬師的表情和舉止就會放鬆下來。這種動物的神經網路並沒有學過算數,但卻懂得判斷人類的肢體語言。「這就是神經網路的神奇之處。」特龍說,「你無法判斷它們在識別什麼信息,就像黑盒子一樣,內部的運作方式是個謎。」


「黑盒子問題」是深度學習領域所特有的。引導這套系統的並不是明確的醫學知識和一系列診斷規則,它只是憑藉大量的內部調整自學了如何區分痣和黑色素瘤,這種調整過程類似於大腦中突觸連接的強化和弱化過程。它究竟是如何判斷某個病變是黑色素瘤的?我們不得而知,它也不會告訴我們。


所有的內部調整和處理過程都都不受我們的監督。我們的大腦同樣如此。當你騎自行車緩慢轉彎時,身體會向相反的方向傾斜。我的女兒也會這麼做,但她並不知道自己這麼做了。黑色素瘤機器必須從圖像中提取特定的特徵。如果它不能告訴我們具體的特徵,是否會有什麼影響呢?這就像是微笑的知識之神。遇到這樣的機器,你就能窺見動物對人類思維的認知:無所不知,但卻無法解釋。

特龍興高采烈地設想了這樣一個世界:我們時刻處於處於診斷性監控之中。我們的手機會通過語音模式的變化診斷阿爾茲海默症。方向盤則會通過輕微的猶豫和顫抖了解帕金森症的早期跡象。浴缸甚至也能在你沐浴時通過無害的超聲波或磁共振進行連續掃描,由此判斷卵巢是否出現了新的紊亂。大數據將會觀察、記錄和評估你的狀況:我們可以逐步掌握更多演算法。要進入特龍這個「浴缸和方向盤的世界」,就要進入由診斷鏡組成的大廳,每一面鏡子都需要更多的檢測。


這番願景的確有著不俗的誘惑力。這樣一個時刻對我們展開細緻掃描的醫療監獄每天都能詳細對比各種醫學影像,這或許可以幫助我們在第一時間診斷出癌症?這能否在癌症診斷方面取得突破?聽起來似乎非常激動人心,但卻有一個問題:很多癌症都是自限性的。我們會與之共同死去,而不是因為它們而死去。如果一個沉浸式的診斷引擎引發了數以百萬沒有必要的活體檢驗,該怎麼辦?在很多情況下,醫學領域的早期診斷都能挽救或延長生命。但也有一些情況可能延長你的焦慮時間,但卻不會延長生命。很難判斷你究竟希望在多大程度上了解自己的病情。


「我很希望加強人類的能力。」在被問及這種系統對人類疾病診斷產生何種影響時,特龍說道,「瞧,工業化種植導致某種耕作方式消失了嗎?的確,但卻加強了我們的農產品種植能力。並非百利無一害,但的確讓我們養活了更多人。工業革命加強了人類的肌肉。當你使用手機時,你的語音能力得以加強。你在紐約大喊一聲,加州的人不可能聽得到。」特龍和我當時的通話其實就遠隔萬里,「而且,儘管你手上的長方形設備讓人類的聲音可以傳播3000英里,可是手機真的能取代人聲嗎?不能,手機是放大設備。認知革命也能以同樣的方式擴大人類的能力。就像機器將人類的肌肉力量增強了千倍一樣,機器也可以讓人類的腦力增強千倍。」


特龍堅稱,這些深度學習設備不會取代皮膚科和放射科醫生,他們可以增強專業人士的能力,為他們提供專業知識和輔助。


「機器學習之父」力挺


在談到機器學習在臨床醫學中發揮的作用時,多倫多大學計算機科學家傑弗里·辛頓(Geoffrey Hinton)顯得更加直接。辛頓的曾祖父喬治·布爾(George Boole),他發明的布爾代數是數字計算的基石,而辛頓有時也被人稱作「深度學習之父」。他從1970年代中期就開始研究這一課題,他的很多學生都成為該領域當今的泰斗級人物。



機器人都能看病了,還需要職業醫生嗎?看完這篇就明白了



「我認為,如果你是一名放射科醫生,那你的處境就像動畫片里的Wile E. Coyote。」辛頓對我說,「你已經跑過了懸崖的邊界,但你還沒有向下看,下面其實已經沒有路了。」商業領域已經針對胸部和心臟成像開發了深度學習系統。「5年之內,機器學習明顯可以超過放射科醫生。」他接著說,「可能是10年。我在一家醫院裡說過這番話,但並沒有獲得廣泛認同。」


辛頓當初在醫院的那番講話很直率:「他們不應該再訓練放射科醫生了。」當我向安吉拉·里格尼利-狄普爾提出這個挑戰時,她指出,診斷型放射科醫生的任務不只是判斷「是否」。他們不僅要尋找導致中風的栓塞,還要注意到其他地方的小出血狀況,這有可能因為誤用溶栓藥物引發災難性後果。他們其實是在尋找一個意料之外甚至可能尚未出現癥狀的腫瘤。

辛頓現在確實有挑釁的資格。「放射科醫生的職責將從感知任務——受過嚴格訓練的鴿子或許也能完成這樣的任務——轉向更多的認知任務。」他對我說。他對自動化醫療的未來預測基於一個簡單的原理:「任何涉及大量數據的傳統歸類問題都可以由深度學習來解決。今後將出現數以千計的深度學習應用。」他希望利用學習演算法來閱讀各種X光、CT掃描和核磁共振成像——這只是他所設想的近期前景。他表示,未來,「學習演算法還可以進行病理診斷。」它們或許可以閱讀子宮頸磨片檢查結果、聽診心音,甚至預測精神病患者的複發。


我們探討了黑盒子問題。儘管計算機科學家都在研究這個問題,但辛頓承認,要打開黑盒子、了解這些強大的學習系統究竟掌握了哪些知識以及它們掌握知識的方式,的確「是不容忽視的挑戰——無論誰告訴你這無關緊要,都不要相信他們。」不過,他還是認為,我們可以適應這個問題。「如果讓一個棒球運動員和物理學家比賽,看誰能更精確地判斷球的落地點。」他說,「棒球運動員扔球的次數超過百萬,雖然他可能完全不了解任何方程式,但卻非常清楚球拋出的高度、速度以及落地點。物理學家可能寫一個方程式來計算相同的事情。但最終,雙方得到的結果可能相同。」


我提到了前幾代計算機輔助檢測和診斷技術在乳房X光成像領域的失望結果。辛頓承認,任何新系統都需要通過嚴格的臨床評估。但他強調稱,新的智能系統可以從錯誤中吸取教訓,然後隨著時間的推移逐步改進。「我們可以開發一套能夠從所有錯誤——一名病人最終可能患上肺癌——中吸取教訓的系統,然後反饋給機器。我們可以問,你錯過了什麼?你能改進診斷效果嗎?人類放射科醫生沒有這樣的系統。如果你錯過了什麼,病人5年之後患上癌症,沒有一套系統化的方式告訴你該如何自我糾正。但你可以開發一套系統來教給計算機實現這一點。」


一些最具野心的機器學習診療演算法希望將自然語言處理(使之可以閱讀病人的病例)和來自教科書、期刊及資料庫的全面的醫學知識整合起來。IBM的沃森健康(Watson Health)和谷歌的DeepMind都希望創造這種全面的系統。我看過其中一些系統的演示,但很多功能仍處在開發階段,尤其是深度學習組件。


辛頓之所以對深度學習診療技術的未來充滿激情,一定程度上源自他本人的經歷。在他開發這類演算法的過程中,他的妻子被確診為胰腺癌晚期。他的兒子也被診斷為惡性黑色素瘤,但後來的活體檢查顯示,這個病變只是基底細胞癌,嚴重程度遠低於黑色素瘤。「這一領域還有很多需要學習的東西。」辛頓輕輕嘆了口氣說,「早期的精確診斷絕對不是不重要的事情。我們可以做得更好,為什麼不讓機器幫忙呢?」


人類醫生的真正意義


3月的一個寒冷的清晨,就在採訪完特龍和辛頓後沒幾天,我來到了位於曼哈頓51街的哥倫比亞大學皮膚病診所。主治醫生林賽·博爾多納(Lindsey Bordone)那天計劃看49個病人。到了10點,候診室里擠滿了人。一位大約60歲留著鬍鬚的男子坐在角落裡,用羊毛圍巾蓋著脖子。還有一對焦急的夫妻在縮在一起翻閱著《時代》周刊。


博爾多納看到她的病人接連不斷地趕到。在一間亮著熒光燈的後屋裡,一位護士坐在電腦前,給出了一句結論:「55歲,沒有病史,皮膚上有新的疑點」——隨後,博爾多納衝進檢查室,她的金髮在身後飄揚。


一位30多歲的年輕男子臉上長了紅色鱗片皮疹。當博爾多納給他做檢查時,他的皮膚掉下一塊,落到他的鼻子上。博爾多納把他拉到燈光下仔細查看皮膚,然後用手持皮膚鏡仔細檢查。


「你頭上有頭皮屑嗎?」她問道。

那位男子看起來很疑惑。「當然有。」他說。


「好的,這是臉上的頭皮屑。」博爾多納對他說,「情況很糟糕,但問題在於為什麼會現在出現這種狀況,又為什麼會惡化。你在頭髮上用過什麼新產品嗎?你的家庭有什麼特別的壓力嗎?」


「肯定有壓力。」他說。他最近失業了,還要應對財務問題。


「堅持寫日記。」她建議,「這樣我們就能判斷二者是否有聯繫。」她開了一個類固醇面霜處方,讓他一個月後再來。


在隔壁的房間里有一個年輕的律師助理,他的頭皮上起了一片發癢的疙瘩。當博爾多納觸摸他的頭皮時,他閃躲了一下。「脂溢性皮炎。」她說道,就這樣結束了檢查。


另外一個房間里的女士已經脫下衣服,換上了病號服。她之前曾經被診斷為黑色素瘤,所以特地來進行預防性檢查。博爾多納仔細地檢查她的皮膚,一個斑點接著一個斑點。她花了大約20分鐘,但卻非常徹底而全面,她用手指划過那片病變的皮膚後,給出了診斷結果。這是痣和角質物,但不是黑色素瘤或癌症。


「看起來還好。」她最後高興地說道。那位女士也鬆了一口氣。


診療仍在進行:博爾多納不斷接診病人,不斷給出診斷結果。如果說辛頓像郊狼,她更像是一隻狂躁的走鵑,片刻不停地接診著患者。當她在後屋裡記筆記時,我跟她提起了特龍關於診療的願景:用iPhone拍一張照片,然後上傳到強大的遠程網路,利用可靠但卻無法理解的專業知識進行診斷。像博爾多納這樣的全職皮膚科醫生一生大約能看20萬個病例。斯坦福大學的機器學習演算法3個月的時間就看了大約13萬個病例。新上任的皮膚科住院醫生卻要從零開始,而特龍的演算法卻可以不斷消化吸收,不斷成長學習。


博爾多納聳了聳肩說。「如果能更加準確地幫我制定決策,我很歡迎。」她說,「有的病人來之前會拍張皮膚病變部位的照片,這樣就能增加我診所的覆蓋範圍。」


這番回復聽起來似乎很合理,我也記得特龍關於增強人類能力的觀點。但隨著機器學習掌握的知識越來越多,人類學習的知識是否會不斷減少?很多父母都懷有這樣的擔憂:他們的孩子都會使用手機上的拼寫檢查功能:萬一孩子因此不再學習拼寫怎麼辦?這種現象被稱作「自動化偏見」。當汽車擁有自動駕駛輔助功能後,駕駛員的警覺性可能降低,醫療領域可能也會發生類似的事情。

博爾多納或許是這個時代的約翰·亨利(John Henry),憑藉一己之力隻身對抗即將進入網路世界的「蒸汽鑽頭」。但我無法忘記她工作時認真的樣子,她始終集中精力,認真地查看每一處病情。如果跟機器合作,她的這種狀態還會繼續下去嗎?


我還注意到博爾多納與病人的互動方式。一方面,病人們離開時的心情幾乎都會好轉。他們得到了醫生的觸摸和診察,還與之進行了對話。就連「痣」和「角化病」這些病變名稱也成為了心靈的軟化劑:讓他們對診療過程深感安心。那位接受了皮膚檢查的女士離開時感覺容光煥發,毫無負擔,臉上的焦慮一掃而光。


此外還有很多。巴西研究人員或許已經猜到了,博爾多納能在一瞬間給出診斷。當她說出「脂溢性皮炎」或「濕疹」等辭彙時,感覺就像在識別一頭犀牛:當她識別出這種模式時,你幾乎總能看到她大腦的下後方椎體神經元發光。但這趟行程並沒有就此結束。幾乎在每次診療過程中,博爾多納都會花很多時間調查病因。為什麼會出現這些癥狀?是因為壓力還是新的洗髮水?是不是有人改變了泳池裡的含氯量?為什麼現在出現病變?


我意識到,這些門診談話中最有用的部分既不是「知其然」也不是「知其所以然」——並不是掌握病例的狀況,或者理解病例形成的模式——而是涉及第三種知識:知其根源(knowing why)。


整體認知:醫療的終極回報


解釋可深可淺。如果你手指上有個紅色水泡,可能是因為你被熱鐵燙了一下,也可能是因為燙傷激發了前列腺和細胞因子的炎症級聯反應,後者的具體過程仍然未被完全揭開。了解和詢問原因是獲得各種解釋的渠道,而解釋正逐漸掌控醫學的進步。辛頓提到過棒球運動員和物理學家,無論是人工智慧還是人類醫生,診斷者都相當於棒球運動員,他們業務熟練,但並不透明。醫學研究者相當於物理學家,他們並不參與臨床診斷,正如理論家並不參與棒球比賽一樣,但這些人都渴望知道「為什麼」。這是一種實用的職責分工,但這或許也會帶來損失?


「深度學習系統沒有任何解釋力。」辛頓直截了當地說。黑箱不能調查原因。事實上,他說:「深度學習系統越強大,就越不透明。隨著提取出的特徵越多,診斷精度就會加強。然而,這些特徵為什麼會從數以百萬的其他特徵中提取出來,仍然是個未解之謎。」演算法可以解決案例,但卻不能創建案例。


但在我自己的腫瘤學領域,我還是不禁注意到,如果熟練的職業醫生同時也是喜愛鑽研的研究人員,往往就能推動醫療技術的進步。事實上,過去幾十年間,有抱負的醫生曾經希望努力成為棒球運動員和物理學家合二為一的角色:他們試圖用診斷中培養起來的敏銳來理解疾病的病理。


為什麼可以通過皮膚病變的不對稱邊緣預測黑色素瘤?為什麼有些黑色素瘤會自然消退?為什麼有的病例中會出現白色斑塊?碰巧的是,診斷專家在臨床中觀察到的這些現象,最終與如今臨床上使用的一些最有效的免疫藥物的發明聯起來。(原來,皮膚變白是免疫反應的結果,這種反應也可以對抗黑色素瘤)。這一連串的發現源自臨床。如果越來越多的臨床實踐被越來越不透明的人工智慧系統取代,如果隱性和顯性知識(知其然、知其所以然、知其根源)之間自發形成的密切關係開始消退,是否就會引發這樣一種狀況:我們可以把能做的事情做得更好,但卻越來越不擅長重新審視我們應該做的事情,越來越不擅長跳出演算法的黑盒子進行思考?


我跟哥倫比亞大學皮膚病學系主任大衛·比克斯(David Bickers)交流過自動化的願景。「相信我,我已經試著去理解特龍論文的所有分支知識,」他說,「我不明白這些演算法使用的數學原理,但我確實知道這種演算法或許能改變皮膚科的實踐方式。皮膚科醫生會失業嗎?我不這麼認為,但我認為確實應該認真思考如何把這些技術融入實踐過程中。使用機器的代價是什麼?如果機器預測錯誤,需要承擔什麼法律責任?如果依靠這樣的演算法,是否會有損我們的實踐,或者損害診斷專家自己的形象?我們最終是否會訓練出一批技術人員,而不再是醫生?」


他看了看錶。有個病人正等他,他要走了。「我這輩子都是診斷醫生和科學家。」他說,「我知道病人多麼依賴我分辨惡性病變與良性病變的能力,我也知道醫學知識都源自診斷。」


他提醒我,「診斷」這個詞來自希臘語,意思是「知其區別」(knowing apart)。機器學習演算法只是更擅於知道這類區別:比如,區分和辨別痣和黑色素瘤。但是無論從哪個維度來看,博學(knowing)都勝過那些專註於解決具體任務的演算法。在醫學領域,最終的回報或許來自於「整體認知」(knowing together)。(編譯/長歌)


推薦:人工智慧洶湧而來,未來已變!關注「AI世代」微信號(tencentAI),關注未來。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI世代 的精彩文章:

深度學習技術能幫助人類診斷皮膚癌 準確率超91%
人工智慧越來越聰明了 它會不會重演「農夫與蛇」的故事?
盤點2016年人工智慧的十大創意項目
霍金警告:自動化和人工智慧將讓這些人大規模失業
人工智慧可以根據長相判斷你是不是罪犯

TAG:AI世代 |

您可能感興趣

如果你的孩子有這些癥狀,可能就是需要打蟲了!
不是所有的多肉都需要修根,看完這個就知道怎麼做了!
神經受了傷需要慢慢養,怎麼養?看看這些做了沒
如果你有以下幾種癥狀,那麼你就需要注意了,你可能要患上抑鬱症了!
這種魚,不需要很複雜的做法,只需要這樣做,就能好吃到不得了!
胃不適,想要把胃養好,就需要做好這些事情,做到了,胃就沒毛病
這些營養的水果,需要一棟房子才能買得起?網友:窮人就別想了
短髮需要怎麼弄才能好看?
防止肝臟「病變」你需要給肝臟再沖洗下了,醫生都在這樣做!
現代職場需要什麼樣的人才?我們還有哪些機會?
孕期可以看牙嗎?這些知識你都需要了解
當女人有這三個表現時,就不需要任何人,也就不再愛你了!
什麼情況下需要帶寶寶看牙醫?看完你就明白了
醫生:身體經常出現這些毛病,說明你的防禦能力下降了,需要注意
女人不管你奔幾了,都需要看看這4句話
女人不管多大了,都需要看看這幾句話!
新生兒夏天需要穿襪子嗎?看完你就知道該怎麼做了!
腿瘦了還是不好看?你的腿型可能需要改善!
聽說你的衣服變瘦了,那就需要了解下織物的縮水率,以及,怎樣還原?
想要女孩倒追你,你只需要這樣做就行了!