當前位置:
首頁 > 新聞 > 「專家痛陳AI醫學影像三大難點」數據規模小、標註質量差、懂演算法的不懂醫療

「專家痛陳AI醫學影像三大難點」數據規模小、標註質量差、懂演算法的不懂醫療

「專家痛陳AI醫學影像三大難點」數據規模小、標註質量差、懂演算法的不懂醫療

1新智元原創

「專家痛陳AI醫學影像三大難點」數據規模小、標註質量差、懂演算法的不懂醫療

三大難點:數據規模小、標註質量差、懂演算法的不懂醫療

以深度學習為代表的人工智慧技術將最先驅動哪一個產業或行業實現全面升級?如果這是一場賭馬比賽,那麼最被大家看好的快馬中,一定有一匹叫做「智能醫療」。

「專家痛陳AI醫學影像三大難點」數據規模小、標註質量差、懂演算法的不懂醫療

中金公司(CICC)6 月 19 日發布的人工智慧相關領域的證券研究報告指出,語音交互、計算機視覺、認知計算等技術蓬勃發展,助推了語音錄入病例、醫療影像智能識別、輔助診療/癌症診斷、醫療機器人、個人健康大數據等多個具體醫療應用場景取得快速突破。

「專家痛陳AI醫學影像三大難點」數據規模小、標註質量差、懂演算法的不懂醫療

對於其中的醫療影像智能識別,報告指出,目前上市公司和創業公司正在紛紛布局,整體處於商業化初期階段。而醫療影像識別的主要難點在於數據獲取、數據標註和跨學科人才積累。

  • 數據獲取:數據是深度學習演算法所需的核心資源,僅掌握演算法而缺乏數據無法獲得較好的訓練效果。現階段,我國的醫療影像仍處於從傳統膠片向電子數據過渡的階段,大量影像資料尚未數字化,且醫院之間的數據共享和互通程度較低,獲取大規模的數據對業內公司是一個考驗

  • 數據標註:在獲取數據的基礎上,深度學習結合先驗知識對模型進行訓練,訓練集需要事先標註。由於大多數標註依賴人工識別,因此數據標註將耗費較大量人力和時間,在醫療影像領域獲取具有高可靠性的標註數據也成為挑戰之一

  • 「AI+醫療」跨學科人才積累:在較為專業的診療領域,應用及平台開發者不僅要研究人工智慧演算法,更要對醫療影像識別建立深入了解,人工智慧+醫療的複合背景人才構成核心競爭力之一

「現在很多公布的結果都經不起推敲」

而報告所指出的醫療影像智能識別的這三個難點,也恰恰成為了這一領域發展的痛點,甚至許多行業亂象正是由此滋生。談到這一問題,深睿醫療的 CEO 喬昕感觸頗深。

「隨著人工智慧技術在醫學影像領域的興起,各種各樣的國際國內大賽、評比、甚至所謂的人機大賽搞得轟轟烈烈,公布的成績從85、90 提升到所謂的 95、98,令人目不暇接,各路人馬高唱凱歌,大有接替醫生之勢。我們在為技術進步感到欣喜的同時,的確應該正確的理解和看待這些先進的科學技術。」

「首先醫學是一門注重實踐、依賴循症的科學。簡單來說,新興技術需要醫生通過長期的實踐,分析總結,找到科學依據,再通過現代統計學的科學方法結合臨床實踐得到最大可能的驗證。這是一套完整的科學體系。」

目前應用人工智慧對某些症像的識別取得了進展, 但是此項技術不論在國內還是國外都還沒有開始大規模的臨床驗證,甚至缺乏驗證的技術和科學方法。

「一旦我們開始討論這個問題就會發現,現在很多公布的結果都經不起推敲。首先是數據的來源和質量,再者就是對結果的評判也需要一個科學的評估標準和體系。」

「目前市場上大部分公司的數據來源是 2-3 家醫院,這實際上數量和質量是遠遠不夠的。以 CT 為例,醫院在用的各種 CT 機型有近百種,廠家有7、8家。在產品化的過程中,如果僅使用幾個機型的數據,或者下載公開數據集的數據來訓練模型,即使實驗室準確率很高,也很難在實際應用中取得很好的效果。這種影像數據的的差異來源於設備的設計上的不同,使用上執行標準和指南的偏差,甚至對使用成本核算上的考量。」

「另外,GE、西門子、飛利浦等公司的大型醫療設備也在不斷的更新,國產品牌快速崛起,而醫療AI公司研發的產品是否可以適應市場上90% 的影像設備,是這樣的產品進行市場推廣的前提。」

這一席話確實道出了困擾醫療影像智能識別發展的一些根本問題。我們這位很敢說的 CEO 擁有豐富的醫療知識背景。他畢業於浙江大學生物醫學工程專業,先後就職於北京大學臨床第三附屬醫院, 西門子(中國)有限公司醫療部。歷任西門子醫療東北亞CT事業部總經理,西門子(中國)醫療事業部大中華區副總裁,醫療服務業務領域總裁。在行業內,喬昕本身就擁有很高的聲譽。

他所在的深睿醫療成立時間不長。2015年年初開始,百度創始七劍客之一雷鳴帶領8 名博士進行智能醫療影像的探索,今年年初研究成果用於所以驗證後,正式成立公司並獲得 3500 萬元人民幣的A輪融資。目前已經完成第一款用於肺癌早期篩查的醫療影像診斷系統,並在多家三甲醫院進行試用。

中金報告所指出的跨學科人才難點,恰恰是深睿醫療的一項顯著優勢。

深睿醫療目前已經組建了近50 人的團隊。科研團隊主要由來自北大和中科院的博士碩士組成,工程團隊由來自BAT等一線互聯網公司的研發人員組成,團隊成員曾在ICCV、AAAI、CVPR 等頂級會議發表多篇文章。公司銷售副總裁Sally.Yang(美籍)為原Terrecon中國區總經理,市場副總裁李朝陽先生為原西門子市場總監,臨床科研總監信穎醫學博士為原西門子醫療資深臨床專家,醫療團隊成員中多人擁有醫學影像碩士博士學位,有著多年醫學影像診斷經驗,與國內醫院影像科、臨床科室保持長期關係。而我們所採訪到的 CEO 喬昕,則更是具有深厚的醫療行業背景與資源。創始核心團隊人才的高度複合性,成為了投資方看好這家公司的重要原因。

「產品化比科研更難:找新的數據,找新的標註,找新的思路」

醫療影像數據的質量和標註難題,深睿醫療自然也遇到過。喬昕表示,深睿醫療的主要團隊在成立前就已經在從事醫療 AI 產品的研發,尤其是肺結節的篩查,在公司成立的時候,已經能取得很高的準確率了。「但是在進行產品化的工作中,我們還是遇到了大量的數據差異化的問題。為了能夠適應更多的使用條件,我們回過頭來,從科研的角度,找合作醫院、找新的數據、找新的標註、找新的思路,然後把問題克服掉。」一路走下來,喬昕感覺產品化的難度一點不比科研的難度小。

目前深睿醫療的肺癌早期篩查的產品已經克服了各個醫院數據不統一、標準不統一的問題,產品開始在多家醫院試用。

另外,喬昕補充說,他們最初的產品定位是給基層醫療機構提供服務的,基層醫療機構拍攝出來的影像與三甲醫院比起來,要複雜得多,質量、標準化等差距非常大,但是基層醫院有較大的需求,要想在基層醫院得到推廣,就必須要克服這些問題。這個過程需要團隊有很深的臨床功底,對基礎醫療以及各個醫院的情況有很深的了解,才能做到。

「為了保證數據標註的質量,在系統訓練前,數據會交由至少兩位以上的資深醫學專家進行標註,如果標註結果不一樣,我們會再聘請一位更高資歷的專家來確定標準,這樣確保用於訓練的數據是可信的。雖然這樣做成本會更加,但這也確保了系統的準確性。」

此外,喬昕強調,目前深睿醫療沒有去一味的追求使用的數量而是非常注重產品的普適性,他們在盡量用各種各樣的臨床數據來驗證他們的產品。

「只有臨床認可,AI 醫學影像才有價值」

作為在醫療領域深耕多年、有深厚醫療行業背景與資源的喬昕,對於 AI 醫學影像和臨床的關係有深刻認識。他認為,AI醫學影像最終是服務於臨床的,其真正的價值要獲得臨床的認可。

這一點獲得了深睿醫療醫學顧問金征宇教授的贊同。金征宇教授是中華醫學會放射學分會候任主任委員,北京醫學會放射·學分會主任委員,中國醫學裝備協會副理事長,中國醫學影像技術研究會副會長,北美放射學會(RSNA)終身會員,中華放射學雜誌副主編。他非常關心 AI 技術的發展,也非常認可深睿注重臨床需求的發展理念。「來自臨床的需求是醫學影像發展的動力,而深睿醫療在這方面取得了顯著的成績」,金教授這樣告訴新智元。

「專家痛陳AI醫學影像三大難點」數據規模小、標註質量差、懂演算法的不懂醫療

中華醫學會放射學分會候任主任委員金征宇(左)和深睿醫療 CEO 喬昕

金教授說:「目前醫療數據80%以上來自醫學影像數據,隨著醫學影像技術的高速發展,一方面海量數據為臨床提供了更多信息, 另一方面對影像科醫生的培養和知識更新換代提出了巨大的挑戰。AI 在醫學影像領域具有廣泛的應用前景,可以輔助醫生提高診斷準確性,降低工作強度,提高工作效率」

「專家痛陳AI醫學影像三大難點」數據規模小、標註質量差、懂演算法的不懂醫療

南京軍區總醫院醫學影像科主任盧光明教授

南京軍區總醫院醫學影像科主任盧光明教授對於AI技術在醫院的應用也充滿了希望: 「在確保數據信息標準有效前提下的醫學影像AI,不僅可以進入醫院用於臨床,甚至還可以結合各種組學的研究,進一步拓展醫學影像信息的臨床價值的邊界」。

醫學影像報告出具以後會傳給臨床醫生,臨床科醫生會根據指南,結合患者的其他臨床數據和身體特徵判斷患者如何進行下一步治療,因此影像科醫生必須了解臨床需求,了解各種指南的臨床意義,提供給臨床有價值的醫學影像信息是影像科醫生的職責。不能臆斷臨床需求。這本身也是對醫療影像智能識別系統的嚴峻挑戰。

「歸根結底,醫療 AI 產品還是醫療產品,是醫療產品就要遵循臨床指南和醫學路徑,不然就不會被醫生接受。」喬昕說。

點擊閱讀原文可查看職位詳情,期待你的加入~

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

「深度学习框架大PK」褚晓文教授:五大深度学习框架三类神经网络全面测评(23PPT)
一張圖看瘋狂的NIPS 2017:十年數據盤點今年NIPS多項「歷史之最」
薦書:生命3.0——生活在AI時代的我們該如何做人

TAG:新智元 |