當前位置:
首頁 > 新聞 > 吳恩達團隊公布最大醫學影像數據集 MURA,基於深度學習檢測骨骼疾病

吳恩達團隊公布最大醫學影像數據集 MURA,基於深度學習檢測骨骼疾病

雷鋒網消息,大量、高質量的數據集推動了深度學習領域的發展。近日,斯坦福吳恩達團隊開源了 MURA 資料庫,包含 14982 個病例的上肢肌肉骨骼X光片。每個病例包含一個或多個圖像,均由放射科醫師手動標記。團隊表示,為鼓勵醫學影像診斷模型的進步,MURA 資料庫可以免費使用。數據集地址為https://stanfordmlgroup.github. io/projects/mura(數據集要2月才會公布)

吳恩達團隊公布最大醫學影像數據集 MURA,基於深度學習檢測骨骼疾病

異常檢測任務,也就是通過組織器官的 X 光片來確定機體的健康狀況,對患病情況進行直接診斷。全球超過 17 億人都有肌肉骨骼性的疾病,這也是導致長期疼痛和殘疾最常見的病因。據雷鋒網了解,每年有 3000 萬左右的急診病例,這個數字還在不斷上漲。

數據採集和訓練

MURA 是目前最大的 X 光片資料庫之一,包含源自 14982 項病例的 40895 張肌肉骨骼X光片。1萬多項病例里有 9067 例正常的上級肌肉骨骼和 5915 例上肢異常肌肉骨骼的 X 光片,部位包括肩部、肱骨、手肘、前臂、手腕、手掌和手指。

吳恩達團隊公布最大醫學影像數據集 MURA,基於深度學習檢測骨骼疾病

表一:MURA 資料庫包含 9067 例正常和 5915 例異常肌肉骨骼影像學研究,包括肩部,肱骨,手肘,前臂,手腕,手掌和手指等上肢。MURA 是最大的公共影像數據集之一。

基於 MURA,我們開發了一個有效的異常檢測模型。將一個或多個 X 光片輸入該模型來研究上肢部分。通過 169 層的卷積神經網路預測每個 X 光片的異常概率,然後得出同一病例所有 X 光片異常概率的平均值,作為 X 光片的異常概率輸出。

吳恩達團隊公布最大醫學影像數據集 MURA,基於深度學習檢測骨骼疾病

圖2.該模型輸入一個或多個 X 光片,通過 169 層的卷積神經網路預測異常的概率,然後輸出異常概率的平均值。

為了有效地評估模型並獲得放射科醫師對於模型的評價,我們從 209 項持續跟蹤的病例中挑選了 6 個病例,收集專業放射科醫生給出的診斷結果。將模型和放射學家給出的診斷結果進行比較,發現模型的診斷能力達到了放射學家相當的水平。在診斷手指和手腕異常時,模型檢測異常的能力強於最好的放射科醫生。然而,在診斷膝、前臂、肱骨和肩部異常時,模型的表現不如放射學家的表現。

機構審查委員會的批准之後,我們通過斯坦福醫院的PACS系統收集了被識別的、符合HIPPA的圖像。我們收集了來自12251名患者、14982項研究的肌肉骨骼放射學數據集,共有40895個多視圖的影像。每一個都屬於七個標準的上肢放射學研究類型之一:肘部、手指、前臂、手、肱骨、肩膀和手腕。表1總結了正常和異常研究的分布情況。

預測模型VS放射科醫生

斯坦福醫院的放射科醫生將2001年到2012年的每項研究手工標記為正常或異常。在對DICOM圖像進行解釋時,對至少300萬像素的PACS醫用級顯示器進行了解釋,其中最大亮度為400 cd/m2,最小亮度 1 cd/m2,像素尺寸為0.2,本機解析度為1500 x 2000像素。臨床圖像在解析度和縱橫比上有所不同。我們將數據集拆分為訓練(11255名患者,13565個研究,37111個圖像)、驗證(788例,1208項研究,3225張圖片)、測試(208個病人,209個研究,559個圖像)。數據集在任何一組患者之間沒有重疊。

為了評估模型並得到放射科醫生的可靠驗證,我們從斯坦福大學的放射學專家那裡收集了一些額外的標籤,這些標籤包括209個肌肉骨骼研究。放射科醫生在使用PACS系統的臨床閱覽室環境中,對每項研究進行了回顧和標記,並將其標記為DICOM文件。放射科醫生平均有8.83年的經驗,從2年到25年不等。放射科醫生沒有獲得任何臨床資料。標籤被輸入到一個標準化的數據錄入系統中。

我們評估了放射學家和模型在測試集上的表現。研究中,我們從6名認證的放射科醫生那裡收集了額外的正常/異常的標籤,選擇了三名放射科醫生來創建一個金標準,利用其他三位醫生來評估人類在這項任務上的表現。

吳恩達團隊公布最大醫學影像數據集 MURA,基於深度學習檢測骨骼疾病

表二總結了放射科醫生和模型在不同研究類型和總體上的表現。放射科醫生在腕部研究(醫生2)或肱骨研究(醫生1和3)上取得了最高的成績,他們在手指研究上的表現最差。該模型在腕部研究中也達到了最高的表現。在腕部研究中,模型表現與最好的放射科醫生表現相當。在所有其他研究類型中,模型的表現明顯低於人類的表現。

吳恩達團隊公布最大醫學影像數據集 MURA,基於深度學習檢測骨骼疾病

表二:每個研究類型和總體上突出表現最佳(綠色)和最差(紅色)表現

有哪些可用的公開數據集?

大型數據集使得深度學習演算法在圖像識別、語音識別和問答等任務中實現或接近人類水平的性能。醫學方面的數據集也幫助科學家在糖尿病視網膜病變、皮膚癌、心律失常、腦出血、肺炎和髖部骨折方面成為小半個「專家」。

吳恩達團隊公布最大醫學影像數據集 MURA,基於深度學習檢測骨骼疾病

表三:公開可用醫學放射影像數據集(第二大的數據集是Pediatric Bone(預測骨齡);0.E.1是關於膝關節的數據集)

表3提供了公共可用數據集的摘要。之前的數據集比MURA要小,但最近發布的ChestX-ray14除外,它是112120個正面的胸片、包含14個胸科病理標籤。然而,標籤並不是直接由放射科醫生提供的,而是由他們的文本報告自動生成。

很少有公開可用的肌肉骨骼X光數據集。斯坦福大學的醫學和成像人工智慧項目提供了一個數據集,包含了帶有骨骼年齡(AIMI)的兒童手部X光片。據雷鋒網了解,數據集是由不同年齡的兒童的左手影像組成,上面標有放射科醫生的骨齡讀數。骨關節炎方面就得看0. E.1數據集了,其中包含標有K&L等級的骨關節炎(OAI)的膝部放射照片。上述的幾個數據集都包含不到15000個圖像。

骨骼肌異常檢測的意義是什麼?

骨骼肌x光片的異常檢測具有重要的臨床應用價值。首先,將異常檢測模型用於工作列表的優先順序排序。在這種情況下,檢測到的異常可以在圖像解釋工作流程中前置,讓最嚴重的患者得到更快的診斷和治療:


正常的檢查可以被適當地劃分為工作列表的較低優先順序;

可以將更快速的結果傳達給醫患雙方,從而優化醫療系統其他領域的配置;

放射學報告模板用於正常研究,可用於檢驗放射科醫生,以便進行更快速的審查和批准。

此外,自動異常定位可以幫助緩解放射科醫生的疲勞。醫療資源的分布不均加劇了這個問題,尤其是在醫療資源集中的城市地區。雖然疲勞是所有醫護專業人員經常面對的一個問題,但放射科醫生非常容易受到影響,進而可能會影響診斷的準確性。有一項研究表明,放射科醫生在當天工作結束時,骨折檢測的效率與工作開始時相比有顯著的下降。

一個可以進行自動異常定位的模型可以突出顯示模型中被識別為異常的部分,引起臨床醫生的注意。如果有效的話,這將有助於更有效地幫助醫生進行閱片,減少錯誤,並幫助提高標準化質量。當然了,該模型還需要更多的研究來進行評估,並且思考如何與其他深度學習模型在臨床環境中進行最優化的整合。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

TAG:雷鋒網 |