NIH開源迄今最大臨床醫療圖像數據集，用深度學習構建通用疾病檢測模型！

新聞 08-16

新智元報道

來源：HIN

作者：大明，聞菲

【新智元導讀】NIH臨床中心最新公布了一個迄今規模最大的多類別、病灶級別標註臨床醫療CT圖像開放數據集DeepLesion，研究人員在此基礎上訓練深度神經網路，創建了一個具有統一框架的大規模通用病灶檢測器，能夠更準確、更自動地衡量患者體內所有病灶的大小，實現全身範圍的癌症初步評估。

NIH開源迄今最大臨床醫療圖像數據集，用深度學習構建通用疾病檢測模型！

4427名獨立的匿名患者
10594次CT掃描（平均每位患者有3次隨訪）
32735個帶標記的病灶實例
一共928020張CT橫切圖像（512×512解析度）

這就是美國國家衛生研究院（NIH）臨床中心最新公開發布的大型CT圖像數據集DeepLesion，也是迄今全球規模最大的多類別、病灶級別標註的開放獲取臨床醫療圖像數據集。

「我們希望這項工作能更好地幫助放射科醫生進行診斷，解決真正有意義的臨床問題。」DeepLesion項目技術負責人、現在已經離開NIH、出任平安科技美國東部研究院院長的呂樂博士在接受新智元採訪時說：「這件工作首先離不開我們在NIH的臨床醫生合作者羅納德·撒莫斯（Ronald M. Summers），他是醫生裡面對技術理解特別深刻的，為獲取這個臨床的大規模醫療數據集提供了極大的幫助和指導。」

「基於DeepLesion數據集，我們開發了一種通用的病變檢測器，第一次為幫助放射科醫生找到患者身上所有類型的病灶提供了技術可能。」DeepLesion項目的主要完成人，NIH臨床中心的博士後研究員閆軻介紹說。

目前，大多數公開可用的醫學圖像數據集，都只含有圖像級別的分類標籤，而有病灶級別標註的數據集，數量往往不足1000，而且大都針對單一類型的病灶，因此訓練出的模型只能檢測一種病灶。而實際病灶的種類非常之多，這種方式就顯得有些低效。

2017年，同樣由呂樂和羅納德·撒莫斯博士率領的另一個NIH臨床中心研究團隊，發布了一個含有超過10萬匿名胸部X光片的標註圖像數據集，大幅推進了相關醫療AI研發，為醫生提供了更好的臨床診斷決策輔助。

這一次，呂樂、羅納德·撒莫斯和他們在NIH的同事，朝著一個更加宏大的目標進發——構建一個囊括各種不同病灶的標註數據集，並在此基礎上設計一個能夠檢測多種病灶的深度學習模型，從而更準確、自動地衡量患者體內所有病灶的大小，實現全身範圍的癌症評估。

NIH開源迄今最大臨床醫療圖像數據集，用深度學習構建通用疾病檢測模型！

基於DeepLesion構建的通用病灶檢測流程圖。來源：[1]

醫生手工標註CT圖像，不適合用於訓練AI

「美國的臨床醫療資料庫里，積累了醫生在臨床實踐中留下的成千上萬個病人的標註數據，」呂樂博士說：「但是，這些標註往往不完整，是醫生為了輔助他們自己的工作進行的，不適合用於訓練AI系統。」

而為了訓練AI系統，請醫生專門對大量的醫療圖像進行標註又是不現實的，因為這需要耗費大量的人力和時間成本。因此，這件事情只有靠計算機設計深度學習演算法來完成。

而要設計深度學習演算法，關鍵就是帶有準確標記的醫療圖像大數據。去除隱私後的公共醫療大數據本就不多，而且不同於其他類型的數據標註，醫療圖像標註需要豐富的臨床經驗，即使是資深醫生，有時候也會在某個標註上產生意見分歧。

其結果就是，真正可用的標註醫療圖像數據集稀缺，儘管各種醫院診所里積累了大量的醫療圖像數據。

要設計深度學習演算法解決臨床問題，「需要對技術和臨床實踐兩方面都擁有深刻的理解，」呂樂博士說：「AI 不是把放射科裡面的東西再重新做一遍。哪些需求是臨床上迫切需要的，哪些需求是當前技術能夠滿足的，將放射科學、計算機科學和人工智慧結合在一起時，有很多需要深度考量和仔細權衡的東西，蠻幹是不行的。」

為了構建DeepLesion數據集，研究人員傾注了一年多的時間，期間在國際醫學圖像計算與計算機輔助干預大會（MICCAI）、北美放射學年會（RSNA）等醫學和放射影像國際頂會以及CVPR上，先後發表了12篇研究論文。

他們將工作成果匯聚為《DeepLesion: automated mining of large-scale lesion annotations anduniversal lesion detection with deep learning》，刊發在《Journalof Medical Imaging》。

NIH開源迄今最大臨床醫療圖像數據集，用深度學習構建通用疾病檢測模型！

現在，任何人都能訪問並使用NIH的DeepLesion數據集（鏈接見文末），醫生能夠更好地進行自動臨床病灶測量或者檢索相似病例，AI研究人員則能進一步完善和推動AI診療技術和產品的研發。

接下來，NIH臨床中心希望通過收集更多數據，不斷完善DeepLesion，提高其檢測的準確性。研究人員還考慮將現在僅含CT圖像的DeepLesion進一步擴展，比如納入MRI圖像，並與其他醫院的數據相結合，構建更加豐富的臨床醫療圖像庫。

DeepLesion：迄今最大的多類別、病灶級標註臨床醫療圖像開源數據集

在NIH臨床中心，每當有患者做完CT掃描後，相應的掃描圖像都會被送至放射科醫生處，然後醫生會對圖像進行解讀。

接著，放射科醫生會使用一種類似電子書籤的工具，測量並標記CT掃描中具有臨床意義的發現。與普通的實體書籤類似，放射科醫生會保存書籤的位置，並將重要發現加上標記，以便以後能再次查閱。

這些書籤的內容和形式很複雜，包括箭頭、線條、長短徑和文字說明等，用於標記病灶的確切位置和大小，以便專家識別病情發展或發現新的疾病。

在計算機視覺領域，為了收集圖像標籤，研究者會採用眾包或搜索引擎抓取，但這並不適用於醫學圖像，因為醫學圖像的標註需要大量的醫學知識和臨床經驗。

在開發DeepLesion數據集時，研究人員決定使用NIH臨床PACS資料庫中的「RECIST diameters」（Response Evaluation Criteria In Solid Tumors）長短徑標註，這種標註是醫生用來測量病灶大小的，被測量的一般都是醫生認為比較重要的病灶，能夠提供最精確的信息，從而確保數據的有效性。此外，這種類型的標註也是NIH資料庫中所有標註類型中佔比最高的一種。

NIH開源迄今最大臨床醫療圖像數據集，用深度學習構建通用疾病檢測模型！

藍線代表醫生在日常工作中對病灶進行的長短徑標註。來源: [1]

決定了要使用的標註類型後，DeepLesion項目的命名人、NIH臨床中心的王潚崧博士與NIH PACS技術管理人員協商，確定了下載方案。隨後團隊編寫程序，把含有長短徑標註的圖像、圖像屬性和標註從原始數據中提取出來，再按照病人編號、CT掃描編號（study index）、序列號（series number）和橫斷層編號（slice number）等進行整理。

在實際場景中，每個病人會進行多次CT掃描（每次掃描的時間點不同），每次掃描會生成多個序列（每個序列的造影劑增強、掃描重建參數等不同），而每個序列都是由幾十到上百個橫斷層圖像組成的3D影像。

數據清理和脫敏是一項浩大的工程。由於下載的電子書籤中含有個別錯誤，研究人員設計了一些規則，清除掉這些錯誤，雜訊、slice interval 信息的計算等，也都進行了手工糾正。

NIH開源迄今最大臨床醫療圖像數據集，用深度學習構建通用疾病檢測模型！

十字交叉的紅線代表醫生日常標註的長短徑標註，綠框代表根據長短徑計算出的邊界框，黃點代表邊界框的中心，兩條相互垂直的藍線表示病灶的 x 軸和 y 軸，z 軸根據SSBR[3]算出。來源：[3]

對於圖像里可能含有的隱私信息，他們先用演算法檢測圖像里的文字，然後人力檢查了圖像里是否有特別的首飾或者明顯的人臉，最後手工抹除相關部分。

「CT圖像的動態範圍較大，因此我們採用16比特無損壓縮png格式來保存所有圖像。這些圖像的使用方法可以參考數據集的FAQ文件，也可以參考論文[5]的源代碼。」

「在開始這個項目之前，沒想到構建資料庫有這麼複雜，」DeepLesion論文的第一作者、NIH臨床中心的博士後研究員閆軻告訴新智元：「不過想到能給其他研究者帶來好處，我們就有了持續前行的動力。」

構建通用疾病檢測模型，推進精準個性化醫療

最終整理好的DeepLesion數據集，含有32735個帶標記的病灶實例，包括來自全身各個部位的關鍵影像學發現，比如肺結節、肝腫瘤、淋巴結腫大等。

NIH開源迄今最大臨床醫療圖像數據集，用深度學習構建通用疾病檢測模型！

DeepLesion數據集中一個子集（15%）的可視化結果，包含骨骼、肝臟、肺部、腹部、軟組織等全身各個部位的數據。散點圖是按照病灶在身體中的相對位置繪製的，可以看做一個人體的正面照。來源：[1]

在實驗過程中，研究人員意識到，雖然不同病灶的外觀差異較大，但目前的深度學習演算法完全有能力同時檢測出各種病灶，從而提供了一個很有希望的新方向——創建一個具有統一框架的大規模通用病灶檢測器。

這個通用檢測器可以作為一種初步的檢測工具來使用，如有需要再將其檢測結果發送給在某些特定類型的病灶上訓練過的其他專用檢測模型。

閆軻說：「我們的數據集里包含了各種病灶，訓練得到的是一個通用的檢測器，雖然在特定種類的病灶上精度可能比不過專用的檢測器，但優點在於覆蓋了各種病灶，可以用來對病人的掃描影像進行一次性的初篩，降低漏檢。」

NIH開源迄今最大臨床醫療圖像數據集，用深度學習構建通用疾病檢測模型！

黃色和橙色框是ground-truth，綠色框是演算法正確檢測到的病灶，紅色框是誤檢。演算法可以較好地檢測出各種病灶，但仍有一些漏檢和誤檢。來源：論文[5]

通用病灶檢測的難度遠高於特定病灶檢測，DeepLesion中包含肺、肝、腎、淋巴、胰腺、骨骼、軟組織等各種病灶，病灶類內差異大，類間差異小（肺、肝的病灶相對容易檢測一些，而一些腹腔中的病灶與周圍正常組織差異較小）。繼續收集數據，可以進一步提高準確率。另外，演算法的改進空間也還有很大。

為了改進病灶檢測的精度，NIH研究人員在MICCAI 2018上發表論文《3D Context Enhanced Region-based Convolutional Neural Network for End-to-End Lesion Detection》[5]，提出了一種利用3D信息的檢測演算法，將病灶識別準確率提高到了84.37%（4 false positives per image）。演算法代碼見[5]。

大規模的臨床醫療資料庫，是AI在臨床真正落地的唯一路徑

除了自動檢測病灶，DeepLesion還可以用於一些其他問題，比如對數據集中每個病灶進行測量。「病灶的測量是放射科醫生的主要任務之一，」閆軻表示：「DeepLesion可以用於設計訓練一個自動測量病灶的演算法，減輕醫生的負擔，同時降低不同醫生帶來的個體差異。」

此外，這個數據集還可以用於進行病灶的分割、分類研究。NIH臨床中心的蔡進錚博士和唐有寶博士利用DeepLesion，提出了弱監督病灶分割演算法，相關論文《AccurateWeakly-Supervised Deep Lesion Segmentation using Large-Scale Clinical Annotations: Slice-Propagated 3D Mask Generation from 2D RECIST》發表在了今年的醫學影像頂會MICCAI 2018。蔡進錚和唐有寶的工作還把所有的二維直徑測量，用弱標註的深度學習演算法，變成了高質量的腫瘤三維體積測量。

NIH開源迄今最大臨床醫療圖像數據集，用深度學習構建通用疾病檢測模型！

基於DeepLesion，提出的弱監督病灶分割演算法得到北美放射科醫生廣泛好評。來源：Twitter

這項工作在北美放射科專科醫生領域裡引發了強烈反響，並收到了非常高的正面評價！主要原因是目前為止基於放射科醫生人工標註的、在腫瘤圖像最大橫截面上的二維直徑測量，也即前文提到的RECIST，是記算並比較腫瘤大小的現行臨床標準。在實際工作中會造成很大的不決定性。基於絕對三維體積的腫瘤大小測量是公認的黃金標準，但因為製作費事費時，在臨床中並沒有被廣泛應用。

這項工作基於DeepLesion資料庫，提出了基於弱監督的深度學習腫瘤圖像分割演算法，從臨床大數據中的直接利用原有的RECIST標註，無需任何額外的人工標註，即可學習和恢復三維的腫瘤分割和體積測量，並取得了好的定量和定性結果。擴展的期刊版本正在準備投稿《Radiology》。

「醫療AI技術的發展就是要讓醫生用起來有價值，真心愛用，」呂樂博士說：「Augmented intelligence for adding clinical value!」

NIH開源迄今最大臨床醫療圖像數據集，用深度學習構建通用疾病檢測模型！

把所有的二維直徑測量變成高質量的腫瘤三維體積測量

DeepLesion里大部分病人都有多次CT掃描的數據，而每次掃描又有多個不同病灶的標註，這為研究不同病灶之間的關係，以及同一病灶隨時間的變化提供了可能。

「總之，這是一個給人很大想像和發揮空間的數據集。」閆軻說。

大規模的臨床資料庫是AI在臨床真正落地的唯一路徑；但標註幾乎永遠不可能是完美的，這就對新的更魯棒的深度學習演算法提出了更多以及更高的要求。

DeepLesion的獲取方式也決定了它存在著一定的局限性。例如，醫生在工作中通常只會標註有代表性的病灶，因此，數據集中存在著一些沒有標出來的病灶。「我們也鼓勵有餘力的醫生能夠在DeepLesion上繼續補全病灶標註，以造福廣大研究者。」

DeepLesion 圖像數據集下載（230G）

https://nihcc.box.com/v/DeepLesion

參考資料

[1] Ke Yan, Xiaosong Wang, Le Lu, Ronald M. Summers, 「DeepLesion:automated mining of large-scale lesion annotations and universal lesiondetection with deep learning,」 J. Med. Imag. 5(3), 036501 (2018), doi:10.1117/1.JMI.5.3.036501. （數據集構建和病灶檢測）

[2] https://arxiv.org/abs/1707.03891（ISBI2017, body part regression）

[3] https://arxiv.org/abs/1711.10535 (CVPR 2018, Deep Lesion Graphs in the Wild: Relationship Learning and Organization of SignificantRadiology Image Findings in a Diverse Large-scale Lesion Database, 病灶檢索與匹配)

[4] https://arxiv.org/abs/1807.01172 (MICCAI 2018; AccurateWeakly-Supervised Deep Lesion Segmentation using Large-Scale Clinical Annotations: Slice-Propagated 3D Mask Generation from 2D RECIST, 病灶分割)

[5] https://arxiv.org/abs/1806.09648（MICCAI 2018, 3DContext Enhanced Region-based Convolutional Neural Network for End-to-EndLesion Detection, 改進的病灶檢測) ，源代碼地址：https://github.com/rsummers11/CADLab/tree/master/lesion_detector_3DCE

[6] https://arxiv.org/abs/1806.09507 (MICCAI2018，Semi-Automatic RECIST Labeling on CT Scans with Cascaded Convolutional NeuralNetworks，病灶測量)

[7] https://arxiv.org/abs/1807.07144 (MLMI 2018; CT Image Enhancement Using Stacked Generative Adversarial Networks and Transfer Learningfor Lesion Segmentation Improvement，病灶圖像增強)

[8] K Yan, Bethesda, MD;X Wang, PhD; L Lu, PhD; L Zhang; A P Harrison, PhD; M Bagheri, MD; et al. "Relationship Learning and Organization of Significant Radiology Image Findings for Lesion Retrieval and Matching"（RSNA ScientificPapers）

[9] Y Tang, PhD, Bethesda, MD; J Cai; L Lu, PhD; A P Harrison, PhD; K Yan; J Xiao; et al. "CT Image Enhancement for Lesion Segmentation Using Stacked Generative Adversarial Networks"（RSNA Scientific Posters）

[10] K Yan, Bethesda, MD; M Bagheri, MD; R M Summers, MD ,PhD; "3DContext Enhanced Region-based Convolutional Neural Network for Universal Lesion Detection in a Large Database of 32,735 Manually Measured Lesions on BodyCT"（RSNA Alternate）

[11] Youbao Tang, Adam P. Harrison, Mohammadhadi Bagheri, Jing Xiao, Ronald M. Summers. "Semi-Automatic RECIST Labeling on CT Scans withCascaded Convolutional Neural Networks" (RSNA Alternate)

[12] https://arxiv.org/abs/1710.01766 (initial version, RSNA 2017)

新智元AI WORLD 2018大會【早鳥票】

開售！

新智元將於9月20日在北京國家會議中心舉辦AI WORLD 2018 大會，邀請機器學習教父、CMU教授 Tom Mitchell，邁克思·泰格馬克，周志華，陶大程，陳怡然等AI領袖一起關注機器智能與人類命運。

大會官網：

http://www.aiworld2018.com/

即日起到8月19日，新智元限量發售若干早鳥票，與全球AI領袖近距離交流，見證全球人工智慧產業跨越發展。

NIH開源迄今最大臨床醫療圖像數據集，用深度學習構建通用疾病檢測模型！