從傳統 CAD 到深度學習驅動的影像系統：智能醫療落地三大技術挑戰

新聞 05-05

新智元原創

從傳統 CAD 到深度學習驅動的影像系統：智能醫療落地三大技術挑戰

圖像識別是深度學習等 AI 技術最先突破的領域，而在 AI 與醫療場景的結合中，目前看來，基於深度學習技術的醫療影像的識別與分析，也很可能會在整個智能醫療、精準醫療領域一枝獨秀，率先進入大規模應用階段。

傳統 CAD 不受醫生的歡迎

實際上，計算機輔助檢測（computeraided detection，簡稱CAD）很早就進入了人們尤其是醫療工作者的視線。有意思的是，很早以前就已經嘗試使用過CAD系統的放射科專家們，在這一波智能醫療影像新技術的推廣中並不熱心，因為在他們的印象中，過去的CAD 主要是靠專家手工編寫判定規則，並不好用。

從傳統 CAD 到深度學習驅動的影像系統：智能醫療落地三大技術挑戰

中華放射學會候任主任委員、北京協和醫院放射科主任金征宇

「起碼15年到20年前，CAD就開始了，為什麼沒有成功?……我們的計算機當時沒有足夠的強大，我們沒有出現領軍人物，沒有社會需求，就沒有成功，CAD那個時候有很有名的公司，後來就沒有了，那個時候CAD簡直不得了。但是，就沒過幾年慢慢就淡出我們視野了。」中華放射學會候任主任委員、北京協和醫院放射科主任金征宇這樣表示。

從傳統 CAD 到深度學習驅動的影像系統：智能醫療落地三大技術挑戰

中華放射學會副主任委員、上海長征醫院放射科主任劉士遠

中華放射學會副主任委員、上海長征醫院放射科主任劉士遠說：「20年前，我們和一些搞計算機的專家就有過合作，當時他們請我為肺癌做一個專家診斷，我來給肺癌做一些診像，根據我定義的診像，把它做成一個系統，計算機系統根據我定義的診像，判斷病灶是良性還是惡性，後來證實這個方法開始有一定準確率，但是到一定程度以後沒法提高，因此就沒有繼續下去。其實各個廠家在臨床工作當中跟我們合作，包括廠家設備裡面也帶了一些軟體，目的也是讓臨床工作當中能夠更容易的發現病變，更容易對病灶定量。當然，這些CAD 解決了一些問題，包括對於一些小病灶的發現，包括對於一些病灶形態的分析和病變。但是，大多數的 CAD 耗時比較長，常規臨床應用存在很大的難度」。

然而醫療影像的識別分析工作，對於人工智慧的需求已然越來越強烈。目前我國醫學影像數據的年增長率約為30%，而放射科醫師數量的年增長率約為4.1%。放射科醫師的數量增長遠不及影像數據的增長。這意味著放射科醫師在未來處理影像數據的壓力會越來越大，甚至遠遠超過負荷。

從傳統 CAD 到深度學習驅動的影像系統：智能醫療落地三大技術挑戰

數據和圖片來源：蛋殼研究院

「我們每天進行影像檢查的人是大幾千……比如說胸部 CT , 一個病人至少要200多張圖片，甚至300多張圖片，一張圖片看3秒鐘的時間，看完一個病人，最起碼要十幾分鐘到半個小時。」華中科技大學同濟醫學院附屬同濟醫院放射科主任夏黎明教授這麼告訴我們，「國內的放射科醫生很苦，早上8點上班，忙到晚上10點還在寫診斷報告。中午很多人都是一邊吃盒飯，一邊看片子。」

從傳統 CAD 到深度學習驅動的影像系統：智能醫療落地三大技術挑戰

華中科技大學同濟醫學院附屬同濟醫院放射科主任夏黎明教授

正在這時，深度學習和神經網路技術對 AI 的強勢賦能開始了。

深度學習 AI 能夠自動尋找特徵，非常適合智能醫療影像

2006年，神經網路領域的大師 GeoffreyHinton 教授與其博士生在《Science》和相關期刊上發表了論文，首次提出了「深度置信網路」的概念。與傳統的訓練方式不同，「深度置信網路」有一個「預訓練」（pre-training）的過程，這可以方便的讓神經網路中的權值找到一個接近最優解的值，之後再使用「微調」(fine-tuning)技術來對整個網路進行優化訓練。這兩個技術的運用大幅度減少了訓練多層神經網路的時間。他給多層神經網路相關的學習方法賦予了一個新名詞——「深度學習」。

從傳統 CAD 到深度學習驅動的影像系統：智能醫療落地三大技術挑戰

2012年，Hinton 教授的研究團隊參加了斯坦福大學李飛飛教授等組織的 ImageNetILSVRC 大規模圖像識別評測任務。該任務包括120萬張高解析度圖片，1000個類比。Hinton 教授團隊使用了全新的多層卷積神經網路結構，突破性地將圖像識別錯誤率從26.2%降低到了15.3%。這一革命性的技術，讓神經網路深度學習以極快的速度躍入了醫療和工業領域，這才有了後來一系列使用該技術的醫學影像公司的出現。

從傳統 CAD 到深度學習驅動的影像系統：智能醫療落地三大技術挑戰

智能醫療背後的演算法演進

卷積神經網路（CNN）以及深度神經網路（DNN）等深度學習方法更真實地模擬了人體大腦對圖像的識別過程，利用數據量以及計算量作為模型驅動力，通過感受野和權值共享減少了神經網路需要訓練的參數個數，最終實現了超越傳統方法的圖像識別性能。

從傳統 CAD 到深度學習驅動的影像系統：智能醫療落地三大技術挑戰

對於醫療領域來說，深度學習自動尋找特徵化的功能非常有用。圖像有不同形態，來自不同的組織，深度學習可以進行分析與處理，讓一些人為誤差得到調整。通過深度學習提取最主要的特徵，它也可以對疾病分類，做圖像分類與分割。無需人為干涉，深度學習演算法就可以從醫學影像中找出許多複雜程度極高，難以用語言詳盡描述出的對比特徵。這些細微的特徵可能是纖維瘤的象徵，也可能是息肉。

想將深度學習應用於醫療影像，先搬到醫院旁邊去住

談到最初將深度學習技術應用於醫療影像領域，推想科技創始人兼 CEO 陳寬告訴我們：「在 2012 年期間，我在美國芝加哥大學修讀經濟學和金融學雙博士，那個時候非常榮幸我的幾位導師都是諾貝爾獎的得主，從他們身上我學到了再簡單、再抽象、再精鍊的數學模式，其實它也是可以幫助我們更好的去解釋，去模擬，去預測，甚至去干預我們現實社會當中的一些實際發生的現象。

從傳統 CAD 到深度學習驅動的影像系統：智能醫療落地三大技術挑戰

推想科技創始人兼 CEO 陳寬

「於是，在博士期間我其實就非常感興趣知道，一些新興的人工智慧的模型，包括深度學習，如何可以在經濟以及政治領域發揮作用。比如說 2012 年的時候，我就跟幾位麻省理工的小夥伴一起用深度學習模型加上機器模型，預測了當年奧巴馬能當選總統。

「我當時自己很想知道深度學習還能在哪一些地方發揮它的價值，於是帶著這樣一個問題，我就回到國內開始博士期間搜集創業的一些機會，那個時候我覺得做技術的人，很多時候就會陷入一個怪圈，比如說認為自己的技術可能天下無敵，解決什麼問題都可以，但是往往當你抱著這樣一個心態去創業，去尋找模式的時候，你可能會發現，你的技術可能連最基本的問題都解決不了，什麼問題都解決不了。

「所以我們就覺得說既然要做這個事情，就必須能夠跟行業結合的非常緊，所以這個階段我就跟各行各業人去溝通、挖掘他們的需求，了解他們的痛點。那個時候我溝通的行業非常多，包括銀行、政府、保安等等，其中有一次我做 PPT 演講的時候，我拿出一個臉像識別來做演示，演示結束之後，有一個放射科醫生走過來，說你做的臉像識別非常有價值，但是能不能幫助我們放射科醫生解決這麼一個問題——他當時提出來使用深度學習技術幫助放射科解決問題。於是我就走訪了各家醫院，發現這樣一個需求是真實存在的，也是一個痛點，既影響了醫生工作也影響了患者的幸福。」

於是，以此為起點，陳寬將全部注意力投入到深度學習在智能醫療影像的應用中。「在 2015 年初的時候，其實在醫療行業幾乎沒有什麼人談論機器學習，也沒有人談論深度學習，很多醫院對新的技術特別感興趣，但是真正願意投入大量的時間和精力做合作的醫院非常有限。所以在那個期間，我走訪了非常多的醫院，從北上廣包括各大省會城市頂尖醫院，走訪了非常多的醫院，但是，願意合作的醫院是比較少數的。直到2015年4月，我成功說服了四川省人民醫院——這也是我們第一家合作醫院——和我們全面的開始合作。當時，我們的資源也比較有限，也不像現在有這麼多夥伴在支持我們，我們兩三個人全部進入到了這個醫院當中，在醫院周圍我們租了一個特別破的公寓，兩三個人每天跟醫生一起上班，一起下班，一起加班，一起解決醫院裡面IT 出現的問題，跟大家打成一片，包括假期的時候，大家都在放假，醫院的急診其實還繼續開著，我們就跟著醫生一起在加班。

「這個過程我覺得非常漫長，基本上工作的環境也不太好。但是，就是在這樣一個過程當中，我們才逐漸摸索出了深度學習非常前沿的技術，非常先進的概念，以及我該怎麼樣在醫院相對比較傳統、相對比較保守、相對比較注重安全、隱私的一個獨特的 IT 環境裡面生根發芽並且產生價值。我們發展到今天，其實這樣一種經驗對我們來說幫助也是非常大的。

「有了四川省人民醫院初步的經驗、初步成果之後，我們就開始逐漸的發展，到2016年3月份阿爾法狗的出現也讓深度學習逐漸走入大眾的視野，所以我們的發展速度也越來越快。從2014年到2017年間，我們已經開始北京協和、武漢同濟、上海長征、大連中山等醫院有一個深度的合作。公司在醫療影像輔助診斷上取得的積極進展，也獲得資本市場的青睞。 2016年2月，推想科技獲得英諾資本、臻雲創投和快的CEO 呂傳偉天使輪1250萬的融資。2017年1月，推想科技獲得紅杉資本領投、廣發證券聯合投資的A輪5000萬融資。」

來自放射科主任的反饋：又快又准

談到和推想科技合作的體會，同濟醫院放射科主任夏黎明教授說：「在上世紀90年代，我們也做過機器的輔助診斷，但它的生命力很短，它是基於人的支持。由我們描述病灶是什麼大小，打分進行診斷，這個診斷是建立在人的基礎上。但是後來陳寬跟我們介紹，現在的深度學習是有人工的神經網路系統，是會學習的，會增長知識的，這是第一點；

第二，這裡面的知識是基於像素水平的，像素是組成圖像的最基本單位。我們的圖像像素解析度越高，結果就更加科學。陳寬的團隊都出自美國的名牌大學，我們當時對他很有信心，我們真正合作在去年5月份，到10月份我們就看到了軟體。我們用它看了11萬張的X光片，看了三千多份CT。當時的結果應該是X光片找到病灶的正確率是超過 92%，CT是超過95%，當時我們感覺很驚奇。這麼短的時間，它的識別能力非常強。所以我們當時感覺這個很有前景。所以給我們的印象是，它的速度快，剛才我們講了，我們看一個人的CT，從肺間到肺里需要十幾分鐘到半個小時，我們的設備需要5秒鐘，這個時間大大縮短，這是第二點；

同時，對於小的病灶，三毫米以內的，人肉眼很容易遺漏掉，但是計算機識別能力比較強。還有，如果病灶密度高，我們容易看到，但如果密度只比正常稍微高一點點，這個時候人肉眼識別就比較困難，但是計算機去識別會比較容易。所以我們初步的使用感覺是相當不錯的。另外，我們也經常隔一段時間交流提出我們的想法，比如說我們需要你把測量病灶的體積、面積、密度的變化，還有打了葯以後對比劑強化的程度怎麼樣。這些會給我們的診斷提供信息。推想科技在逐步實現我們的想法，逐步在讓產品不斷的完善。這是我對初步合作的體會。「

上海長征醫院放射科主任劉士遠則如此評價和推想科技的合作效果：「從目前長征醫院六千多例多中心篩查的結果來看，通過我們標記形成的模型，目前已經準確率已達到了85% 以上，這種結果還是很讓我們興奮，我相信隨著設備硬體的發展，隨著神經網路進一步的進化，隨著數據量進一步的增加，準確性、敏感度還會進一步的提高。「

那麼，從技術層面來講，在將深度學習應用於醫療影像的識別與分析的過程中，主要面臨的挑戰有哪些？帶著這個問題，我們對推想科技創始人兼CEO陳寬進行了專訪。

需持續關注的三大技術挑戰

對於這一問題，陳寬非常有發言權。

「第一，傳統的 ImageNet 的影像，相對於醫學影像來說，沒有那麼高清，而且需要識別的物體在整個圖像中佔據比較大的比例。比如ImageNet 的圖像解析度可能是 299 X 299，需識別物體佔據圖像的 70%-80%。而醫學影像中，X 光的常見影像解析度是3000 X 3000，是 ImageNet 解析度的大約100倍；而 CT 常見的解析度則是 512 X 512，再乘以一個300~400，甚至多至好幾萬個平面。它的解析度很高，維度很高。有時是三維的，fMRI 甚至是四維的，需要配合上時間的變化。它的解析度高，維度高，這裡面的挑戰在於，需要識別的結節在影像當中只佔一個非常非常小的區域。這是識別中一個很大的瓶頸和難點，也是研究者一直在著手解決的問題。我們的解決方案，是找到更適用於醫學影像識別的模型，去努力把檢測區域變小。但這樣一來又會使得假陽性增高，會把和結節相似的血管等等全部都找出來，這樣醫生就不會喜歡去用。所以技術上的一大挑戰就是如何在提高靈敏性的同時，把假陽性降低。

「第二個挑戰是，醫生在診斷過程中，需要知道系統做出判斷的理由。但我們知道，深度學習的過程是一個黑箱，如何增加模型的可解釋性，這其實是醫療用模型一個需要解決的痛點。在這個層面，可能大家都沒有什麼好的解決方案。去年有一個比較火的方法，叫作注意力模型（ Attention Model）。注意力模型可以在一定程度上告訴我們，它究竟是看到了什麼，才做出了相應的診斷結果。這可以帶來一定的可解釋性，但這仍然是我們需要持續關注、持續去研究的問題。

」第三個挑戰可能和深度學習技術不直接相關，而是和技術的部署、落地有關，就是醫院的 IT 環境具有一定的特殊性，它和進行深度學習研究以及其他任務的環境有很大不同。比如我們的深度學習模型升級了，有一些新的方法出現，正常情況下我們的技術人員可能會到GitHub 上去問問題，找資源。但是醫院的 IT 環境非常強調安全、穩定和隱私，不允許將醫院的數據，特別是將病人的數據帶到醫院的環境之外。現在，假如我們的一個程序升級了，我們無法直接將它加入到系統中，而是必須先走完醫院相關的審批流程，符合它們IT 的生態，慢慢才能加入到系統當中。這種工作方式可能對於很多已經習慣了在開源環境下工作的開發人員來說，是一個很實際的困擾。在過去的一段時間內，我們也建立起了自己的一套機制，讓我們的深度學習模型，更好地生長在醫院這個比較獨特的IT 環境當中。當然，這首先要基於對醫院真實情況的了解。

最重要的一點就是接地氣扎進去，我分享一個我們早期開始做的時候的一個故事，當時我們剛進入四川省人民醫院幾個月時間，兩個月過去之後我們跑通了我們的模型，根據當時的情況就做了一版出來，一看那個結果，準確率99.9%，當時我第一感覺是，我們公司可能明年就可以上市了。後來一想準確率如果這麼容易上去，所有人都可以做出來，後來我們仔細觀察，仔細梳理，最後發現我們做錯了一個非常基本的問題。問題就在於我們對於醫院的IT 系統不了解，醫院裡面所有系統之間的數據打通，數據的互聯是有背後的一套邏輯在裡面，但是這個邏輯非常複雜。咱們醫院裡面不同科室的人，可能任何一個科室都沒有辦法把這個問題說清楚，當時我們不太了解這些生態，不太了解數據流動的過程，最終就做錯了一件很基本的關聯性的問題，所以當時就鬧出了這麼大的烏龍。

我覺得最關鍵的就是，能夠深入到這個行業裡面，了解專家、了解日常寫報告的醫生面臨的痛點，了解醫院IT 系統當中所有不同的生態，如何跟生態當中不同的人打交道，我覺得這其實是我們做人工智慧的這些人面臨的最大挑戰。在美國、英國學這些專業的時候，基本上把數據清理的很乾凈，拿出來很不錯的模型發表文章就可以了。但是真正進入這個行業的時候，就會發現太多的細節都有可能造成模型跑不出效果，或者跑不出一個很好的效果。所以在這個環節當中，我覺得真的能夠扎進去，深入進去，而且能夠跟咱們的用戶一起來成長，這才是一個最大的挑戰。」

新智元招聘

職位：客戶經理

職位年薪：12 - 25萬（工資+獎金）

工作地點：北京-海淀區

所屬部門：客戶部

彙報對象：客戶總監

工作年限：3 年

語言：英語 + 普通話

學歷要求：全日制統招本科

職位描述：

精準把握客戶需求和公司品牌定位，策劃撰寫合作方案；
思維活躍、富有創意，文字駕馭能力強，熟練使用PPT，具有良好的視覺欣賞及表現能力，PS 能力優秀者最佳；
熱情開朗，擅長人際交往，良好的溝通和協作能力，具有團隊精神；
優秀的活動籌備與執行能力，較強的抗壓能力和應變能力，適應高強度工作；
有4A、公關公司工作經歷優先；
對高科技尤其是人工智慧領域有強烈興趣者加分。

崗位職責：

參與、管理、跟進上級指派的項目進展，確保計劃落實。制定、參與或協助上層執行相關的政策和制度。定期向公司提供準確的市場資訊及所屬客戶信息，分析客戶需求，維護與指定公司關鍵顧客的關係，積極尋求機會發展新的業務。建立並管理客戶資料庫，跟蹤分析相關信息。

應聘郵箱：jobs@aiera.com.cn

HR微信：13552313024

新智元歡迎有志之士前來面試，更多招聘崗位請點擊【新智元招聘】查看。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

TAG:新智元 |

您可能感興趣

※影譜科技：深度學習讓系統「智能生產」影像內容
※影譜科技與北大信管達成戰略合作，推動智能影像生產技術落地
※MR指紋技術在醫學影像診斷中的應用
※心血管領域獨樹一幟，數坤科技能否領跑醫療影像AI落地進程？
※影像學技術早期肝癌的「偵察兵」
※觀界科技CEO劉天成：深耕行業應用，探索下一代影像技術
※高科技走進手術室？醫生戴VR眼鏡做全息影像手術
※華為新影像大賽重裝，「新技術」加持，華為推動移動影像技術發展
※裂變式增長下的影像服務新模式，「VPhoto」通過雲技術與智能硬體推動行業標準化
※中國研究再登Cell封面，AI影像診斷系統精準度堪比頂尖醫師
※教學技巧之模糊影像的魅力
※IDRiD 眼底影像分析挑戰賽結果出爐，科大訊飛、平安科技表現不俗
※影譜科技推動智能影像生產市場在亞洲崛起
※中國科學家研發的AI影像診斷系統首登頂級期刊，一系統診兩大類病
※影譜科技與北大達成戰略合作，共建智能影像生產實驗室
※推想科技：用 AI 為影像科醫生打造第二雙眼睛，讓肺結節無所遁形｜創業
※想完成中高端眼科器械的進口替代，「圖湃影像」自主研發掃頻 OCT 視網膜診斷系統
※學界 | 點內科技、華東醫院及上海交大合著論文：3D深度學習在CT影像預測早期腫瘤浸潤方面超過影像專家
※《細胞》重磅：中國科學家研發的AI影像診斷系統首登頂級期刊，可診斷眼病和肺炎兩大類疾病，準確性匹敵頂尖醫生｜科學大發現
※點內科技、華東醫院及上海交大合著論文：3D深度學習在CT影像預測早期腫瘤浸潤方面超過影像專家