吳恩達論文登上Nature Medicine!利用神經網路診斷心率不齊
選自Stanford ML Group
作者:Awni Y. Hannun等
機器之心編譯
機器之心編輯部
近日,吳恩達團隊開發了一種深度神經網路,可以基於單導程心電圖(ECG)信號診斷心率不齊,且診斷性能堪比心臟病醫生。
ECG 是醫療實踐中的基礎工具,全世界每年有超過 3 億張心電圖,它在診斷心律不齊過程中起關鍵作用。近日,吳恩達團隊在 Nature Medicine 上發表了一項研究,開發了一種深度神經網路,可基於單導程 ECG 信號分類 10 種心率不齊以及竇性心律和噪音,性能堪比心臟病醫生。
你能從上圖中分辨出心律不齊嗎?神經網路可以準確地檢測出這屬於 AVB_TYPE2 類型。
該團隊開發了一個 1D 卷積深度神經網路,可基於任意長度 ECG 時序數據檢測心律不齊。該網路使用原始 ECG 數據作為輸入(以 200 Hz 進行採樣,即每秒 200 個樣本),並每 256 個樣本(每 1.28 s)輸出一個預測結果。該網路只需要原始 ECG 樣本作為輸入,無需病人或 ECG 相關的其他特徵。該網路架構共有 34 個層,為簡化網路優化,研究人員使用類似殘差網路架構的捷徑連接(shortcut connection)。
與近期其他 DNN 方法不同,ECG 數據無需經過大量預處理(如傅立葉變換或小波變換),就可以獲得強大的 DNN 分類性能。
該團隊構建了一個大型 ECG 數據集,該數據集經過專家標註,包含大量 ECG 心律類型。
他們的數據集包含了來自 53877 名成人患者的可回溯、去識別數據,這些患者大於 18 歲,使用的是 iRhythm Technologies 公司的 Zio 監護儀,這是一種美國食品和藥物管理局(FDA)批准的單導程、基於塊的動態心電圖監護儀,在 200Hz 下持續記錄來自單個載體(改良的 Lead II)的數據。
心電圖記錄是根據 iRhythm Technologies 公司臨床工作流程產生的報告摘要提取的,其中包括由正規心電圖技術人員對演算法的初始注釋進行的全面審查,這種演算法得到了 FDA 510(k) 的批准,可以用於臨床。研究人員隨機採樣心率不盡相同的患者,並從這些患者中抽取了 30 秒可進行心率分類的記錄。儘管目標心率類別通常出現在記錄中,但大多數記錄包含多種心率。為了進一步改善訓練數據集中類的平衡,該團隊故意對 AVB 等罕見的心率進行了過度採樣。
在獨立測試數據集上對比 DNN 和心臟病學家的診斷能力
測試數據集由 328 個 ECG 記錄構成,收集自 328 個獨特的病人,這些記錄由一個由心臟病專家組成的共識委員會進行注釋。
除了一個心臟病共識委員會的注釋,測試數據集中的每個 ECG 記錄還包括六個單獨的心臟科醫生的注釋,這些醫生不屬於該委員會。利用這些委員會標籤作為黃金標準,研究人員比較了 DNN 演算法 F1 得分與平均每個心臟病醫生的 F1 得分,F1 得分是陽性預測值(PPV,查准率)和靈敏度(查全率)的調和平均值。心臟科醫生 F1 得分是 6 個單獨的心臟科醫生 F1 得分的平均值。
結果,DNN 的 F1 平均得分超過了心臟科醫生。DNN F1 得分的趨勢與心臟科醫生平均 F1 得分的趨勢一致:二者在類似類別上的 F1 分數都比較低,如室性心動過速和房性異位節律(EAR)。
將特異度固定在心臟科醫生達到的平均特異度水平,DNN 的靈敏度超過心臟科醫生在所有心律分類中的平均靈敏度。
研究人員發現該模型在所有心律類型分類中的表現足以比肩、甚至超過心臟病醫生的平均表現。
研究人員繪製了序列級心律分析的 ROC曲線和 PR 曲線,下圖以心房顫動為例。單個心臟病醫生的表現和心臟病醫生的平均表現也顯示在下圖中。
研究人員發現 DNN 似乎可以概括單個心臟病醫生的錯誤分類。
對錯誤分類部分進行人工審核後發現,DNN 的錯誤分類整體上非常合理。在很多情況下,缺乏語境、信號長度有限、單導程等原因導致無法從數據中得出合理結論,這使得研究人員很難確定委員會和演算法誰是正確的。類似的因素和人類錯誤可能解釋 72.8% 的標註者之間的分歧。
下面兩個混淆矩陣展示了類似的模式,圖中將分類時更容易出問題的心律類型突出顯示(即 SVT 和 atrial fibrillation、 junctional 和 sinus rhythm、EAR 和 sinus rhythm)。
研究人員在來自不同患者群體的外部數據集上驗證了其 DNN,發現該模型的表現頗具競爭力。
為了證明 DNN 架構能夠泛化至外部數據,研究人員將 DNN 模型應用於 2017 PhysioNet 挑戰賽數據,該數據包含 4 種心律:竇性心律、心房顫動、雜訊和其它。保持 DNN 架構不變,也不調整任何超參數,研究人員在開源訓練數據集(n = 8,528)上訓練其 DNN 模型,保留了 10 % 的開發數據集,以便提前停止。DNN 在隱藏測試數據集(n = 3,658)上的表現顯示 F1 總分屬於競賽中表現最好的分數之一,每類心律平均 F1 分數為 0.83。
論文:Cardiologist-level arrhythmia detection and classification in ambulatory electrocardiograms using a deep neural network
論文鏈接:https://www.nature.com/articles/s41591-018-0268-3
摘要:
計算機心電圖(ECG)解釋在臨床 ECG 工作流程中起著至關重要的作用。廣泛可用的數字 ECG 數據和深度學習演算法範例為大幅提升自動 ECG 分析的準確性和可擴展性提供了機會。然而,目前還沒有在各種診斷類別上對用於 ECG 分析的端到端深度學習方法進行全面評估。在本文中,研究人員開發了一種深度神經網路(DNN),用來自 53549 名使用單導程動態心電圖監測設備患者的 91232 個單導程心電圖對 12 種心律進行分類。當對照共識委員會(由董事會認證的執業心臟病專家組成)注釋的獨立測試數據集進行驗證時,DNN 在受試者工作特徵曲線(ROC 曲線)下的平均面積為 0.97。其平均 F1 分數(即陽性預測值和敏感度的調和平均值)為 0.837,超過了平均心臟病專家(0.780)。由於特異度固定在心臟病專家達到的平均特異度上,DNN 的敏感度超過了心臟病專家對所有心律等級的的平均敏感度。這些發現表明,端到端深度學習方法可以將各種不同的心律失常從單導程心電圖中區分開來,具有類似於心臟病專家的高診斷性能。如果在臨床環境中得到實證,該方法將可以通過準確地篩選或優先考慮最緊急的情況,降低計算機 ECG 解釋的誤診率,並提高人類專家 ECG 解釋的效率。
原文鏈接:https://stanfordmlgroup.github.io/projects/ecg2/
本文為機器之心編譯,
轉載請聯繫本公眾號獲得授權
。?------------------------------------------------
加入機器之心(全職記者 / 實習生):hr@jiqizhixin.com
投稿或尋求報道:
content
@jiqizhixin.com廣告 & 商務合作:bd@jiqizhixin.com


※快速上手筆記,PyTorch模型訓練實用教程
※線性代數與數據學習:MIT教授Gilbert Strang幫你打下堅實的數學基礎
TAG:機器之心 |