阿里健康奪冠中文電子病歷實體識別評測任務
雷鋒網AI科技評論消息,全國知識圖譜與語義計算大會(CCKS 2018)於 8 月 14 日至 17 日在天津舉行。在中文電子病曆命名實體識別評測任務中,阿里健康團隊奪得冠軍。
CCKS 是由中國中文信息學會語言與知識計算專業委員會(CIPS)定期舉辦的全國年度學術會議,致力於促進中國語言與知識計算領域的學術研究和產業發展,為從事相關領域理論和應用研究的學者、機構和企業提供廣泛交流的平台,已經成為國內知識圖譜、語義技術、語言理解和知識計算等領域的核心會議。
這一事件在雷鋒網旗下學術頻道AI科技評論資料庫產品「AI 影響因子」中獲得相應加分。
CCKS2018 的電子病曆命名實體識別任務基於 600 份標註好的電子病歷文本,參賽者需通過識別並抽取出其中與醫學臨床相關的實體,並將它們歸類到預先定義好的類別中,包括解剖部位、獨立癥狀、癥狀描述、手術和藥物等五類實體。
阿里健康團隊以兩種序列標註演算法為基礎,首次在醫療文本領域採用了 cw2vec 的方法構建詞向量矩陣,基於全部的非標註文本和標註文本集訓練詞向量,以解決新字無法識別的問題;同時改進了漢字結構和拼音的特徵的一般方案。最終,團隊以嚴格指標 0.8913 的成績取得了第一名。
「醫療命名實體識別只是我們團隊工作的一小部分,也是我們面向醫院和醫生提供醫療人工智慧服務的基礎。」阿里健康人工智慧實驗室主任范繹表示,阿里健康團隊長期專註通過實體識別、實體鏈接、關係提取等手段從電子病歷中識別信息,並在此基礎上對信息進行融合和整合,以知識圖譜的呈現形式,為其他服務提供數據基礎。
據了解,基於電子病曆數據,阿里健康打造了大數據科研平台、臨床輔助決策引擎等針對醫院和醫生的多款產品,為廣大醫生和用戶提供更加智能的用戶體驗,幫助其提升專業水平和工作效率。
電子病歷結構化是讓計算機理解病歷、應用病歷的基礎。基於對病歷的結構化,可以計算出癥狀、疾病、藥品、檢查檢驗等多個知識點之間的關係及其概率,構建醫療領域的知識圖譜,進一步優化醫生的工作。


※周產 5000 台目標終於達成!Model 3 這次真要起飛了嗎?
※前有「老大哥」,後有「新勢力」,AI+教育江湖誰主沉浮?
TAG:雷鋒網 |