專訪:機器閱讀理解助力中國人工智慧彎道超車
「機器閱讀理解比賽前幾名都是我們中國人的研發團隊……相信中國在人工智慧這個領域會彎道超車,達到世界頂尖水平。」微軟亞洲研究院副院長、國際計算語言學協會(ACL)候任主席、中國中文信息技術專委會主任周明日前在接受新華社記者專訪時說。
今年1月,在機器閱讀理解領域頂級賽事、由美國斯坦福大學發起的SQuAD挑戰賽上,位列前幾名的團隊包括微軟亞洲研究院、阿里巴巴、科大訊飛和哈工大聯合實驗室,他們各自提交的系統模型先後超越了人類解答的分數。計算機文本理解能力在這個測試上首次超越人類,成為自然語言處理領域一個重要里程碑。
在中國自然語言處理領域,中文自然語言評測也如火如荼,且難度和題量都更大。3月1日,由中國中文信息學會和中國計算機學會聯合主辦、百度公司承辦和資助的2018機器閱讀理解技術競賽將正式啟動。
通常,機器閱讀理解的定義是讓機器閱讀文本,然後回答和閱讀內容相關的問題。在周明看來,自然語言理解是人工智慧「皇冠上的明珠」,而機器閱讀理解是自然語言處理中最關鍵的部分。
目前,自然語言處理技術在神經機器翻譯、智能搜索、智能客服、聊天機器人甚至文藝寫作等方面都有廣泛應用。周明說,隨著大數據、深度學習和運算能力的提高,機器閱讀理解水平近兩年突飛猛進,尤其是在閱讀理解評測上達到了人類任務的標準水平。同時,自然語言理解的突破,也將從技術上反哺圖像識別和語音識別等領域。
周明用金字塔形狀來描繪人工智慧技術和應用的不同層次。他說,現在整個人工智慧體系主要是感知智能和認知智能,最底層是感知智能,自然語言更多的是屬於認知智能,越往上越難,比如再往上的創造智能。「今後,隨著自然語言處理技術更強的突破,將帶動認知智能突破,從而推動整個人工智慧的突破和發展。」
不過,周明也指出,機器閱讀理解超越人類,並不能表明機器的能力就超越了人類。機器擬合數據的能力足夠強,但在推理、知識圖譜以及人類通用知識和常識方面,機器的能力仍然是非常脆弱的,目前仍未解決。周明認為強人工智慧遠未到來,但這並不妨礙局部人工智慧或者垂直領域的人工智慧將會逐步接近甚至是達到與人類相仿水平。
目前在自然語言處理領域,中美兩國遙遙領先。周明列舉了一個指標說,在該領域頂級國際會議——ACL大會上,中國過去5年的論文投稿錄取數僅比排在第一位的美國相差20篇左右。
美國白宮2016年的《國家人工智慧研究與發展策略規劃》報告中也提到,2014年和2015年中國在人工智慧研究的一個分支——深度學習領域發表的論文數量超過了美國,居於領跑者位置。
根據中國政府去年印發的《新一代人工智慧發展規劃》戰略目標,中國人工智慧總體技術和應用到2020年將與世界先進水平同步,到2030年達到世界領先水平。周明說,中國在自然語言處理這個領域的發展恰好同人工智慧的規劃基本上是合拍的,即「到2020年中國自然語言技術全面達到世界先進水平,希望到2030年引領全世界」。
談到中國在人工智慧領域的整體發展,周明認為中國有多方面的優勢。首先,中國有一個清晰的藍圖,政府有明確的綱要,從政策到投資,都鼓勵人工智慧的發展。
其二,中國擁有世界上最龐大的網民群體,無論是電子商務、搜索,還是辦公、語音等等,有強烈的用戶需求。
其三,目前的工業和產品都是數據驅動的,那就意味著誰掌握數據,誰掌握場景,基本就掌握了主動權。現在中國講究數字化轉型,各行各業的需求都要數字化,數字化再往上是智能化。比如交通、醫療、教育、司法、金融等,都有大量數據,這些領域只要把數據做好,然後加入人工智慧的一些能力,就將會極大提高整個社會生產力。
其四,中國過去幾十年的積累,基礎設施都比較齊備,包括人工智慧的人才儲備,而且將會有越來越多的投資促進公司和高校研發力量不斷增強人才培養。
不過,周明指出,中國人工智慧領域的拔尖人才,尤其是能夠提出領先理念的領軍人物相比美國少很多。「我們一開始可能是追隨者,但到了一定程度後,我們應該有自信心來引領世界人工智慧,包括自然語言理解的潮流。」
來源:新華網


TAG:維科網_高端訪談 |