阿里巴巴AI打破世界紀錄,閱讀精準率首度超越人類!
人工智慧再取得重大突破!觀察者網報導,1月11日,由斯坦福大學發起的機器閱讀理解領域頂級賽事SQuAD刷新排名,人工智慧的閱讀能力歷史上首次超越人類。阿里巴巴憑藉82.440的精確率打破了世界紀錄,並且超越了人類82.304的成績。
據報導,SQuAD的負責人Pranav Rajpurkar難掩興奮之情。他在社交媒體上表示,2018年一個強勁的開始,第一個模型(阿里巴巴iDST團隊提交的SLQA +)在精確度匹配上超越人類表現!下一個挑戰:模糊匹配,人類仍然領先2.5分!
SQuAD比賽構建了一個大規模的機器閱讀理解數據集(包含10萬個問題),文章來源於500多篇維基百科文章。人工智慧在閱讀完數據集中的一篇短文之後,需要回答若干個基於文章內容的問題,然後與標準答案進行比對,得出精確匹配(Exact Match)和模糊匹配(F1-score)的結果。
SQuAD是行業內公認的機器閱讀理解頂級賽事,吸引了包括谷歌、卡內基美隆大學、史丹佛大學、微軟亞洲研究院、艾倫研究院、IBM、Facebook等知名企業研究機構和高校的深度參與。
報導指出,此次技術的重大突破源於阿里巴巴研究團隊提出的「基於分層融合注意力機制」的深度神經網路模型。該模型能夠模擬人類在做閱讀理解問題時的一些行為,包括結合篇章內容審題,帶著問題反覆閱讀文章,避免閱讀中遺忘而進行相關標註等。
模型可以在捕捉問題和文章中特定區域關聯的同時,藉助分層策略,逐步集中注意力,使答案邊界清晰;另一方面,為避免過於關注細節,採用融合方式將全局信息加入注意力機制,進行適度糾正,確保關注點正確。
阿里巴巴自然語言處理首席科學家司羅表示,對於解決wiki類客觀知識問答,機器已經取得非常好的結果,將繼續向對通用內容的「能理解會思考」的終極目標邁進。今後,研發的重點在於把這項技術真正應用在廣大實際場景,讓機器智能普惠生活。
事實上,這項技術已經在阿里巴巴內部被廣泛使用。比如,每年雙11都會有大量的顧客對活動規則進行諮詢。阿里小蜜團隊通過使用司羅團隊的技術,讓機器直接對規則進行閱讀,為用戶提供規則解讀服務,是最自然的交互方式。
為中國技術點贊助威!


TAG:科技刊 |