NIH發布包含 10600張CT 圖像資料庫,為 AI 演算法測試鋪路
雷鋒網消息,美國國立衛生研究院(NIH)最近發布了一個龐大的胸部X光資料庫,現已公開近10600張CT掃描圖像,以支持醫療人工智慧演算法的開發和測試。
這個大型成像資料庫被稱為DeepLesion,是由美國國立衛生研究院的Ronald Summers及其同事創建的。他們對其機構里的放射科醫生的CT掃描結果進行了臨床相關的標註。
Summers是NIH影像生物標記和計算機輔助診斷實驗室的高級研究員和放射學家。
根據美國國立衛生研究院的說法,這些標註通常很複雜,包括描述病變大小和位置的箭頭、線條、分割和文本,以便讓臨床醫生可以監測疾病變化。標註醫學圖像需要廣泛的臨床經驗,並且會耗費大量時間。
實際上,缺乏可用於訓練AI演算法的大型醫學圖像資料庫一直被認為是AI技術尋求突破的主要障礙之一。Summers及其同事的努力就是為了改變這種狀況,至少在X光方面 。去年他們發布了ChestX-ray8資料庫,庫中包含了100000張X光圖像。
DeepLesion通過提供足夠強大的CT掃描資料庫和附帶的標註來訓練深度神經網路,從而幫助繞過這些障礙。美國國立衛生研究院建議,有朝一日可以「使科學界能夠創建一個具有統一框架的大規模通用病變檢測器」。
雷鋒網了解到,該資料庫包括來自馬里蘭州貝塞斯達NIH臨床中心的4400多名患者的大約10600項研究。雖然目前大多數資料庫包含10至數百個單一類型的病變,但該組設計的DeepLesion可容納超過32000個病灶,涵蓋各种放射學發現,如肺結節、淋巴結腫大和肝腫瘤。
有了多範疇的病變資料庫,DeepLesion為研究人員提供了開發人工智慧演算法的機會,能夠自動檢測和診斷多種病變類型。美國國立衛生研究院指出,未來它還可能發展成為一個通用病變檢測器,可用作初始篩選工具,並將其結果發送到其他更專業的演算法。此外,研究人員可能可以在同一次CT掃描中研究不同類型病變之間的關係,從而全面評估癌症負擔。
為了開始展示這種潛力,Summers及其同事用DeepLesion資料庫來訓練一個典型的通用病變檢測器,以發現各種病變。他們的探測器靈敏度達到81.1%,每個圖像有5個假陽性。
據雷鋒網了解,研究人員計劃繼續向DeepLesion添加圖像,以提高檢測器的準確性,他們希望將MRI掃描包含在資料庫中,並結合未來多家醫院的數據。該研究小組認為,除了病變檢測外,該資料庫還可以幫助訓練演算法對病變進行分類,並根據現有模式預測病變的發展。


※來圍觀 UC 伯克利和CMU的「踩高蹺走梅花樁」機器人
※中興已清除障礙 美國禁令即將解除;富士康在矽谷成立AI公司;小鳴單車破產清算
TAG:雷鋒網 |