當前位置:
首頁 > 新聞 > 微軟沈向洋發文總結聊天機器人的前世今生,對話系統的全新時代正在來臨

微軟沈向洋發文總結聊天機器人的前世今生,對話系統的全新時代正在來臨

近日,微軟全球執行副總裁沈向洋、微軟研究院首席研究員何曉東、微軟(亞洲)互聯網工程院副院長李迪(小冰項目負責人)在預印本網站arXiv發布一篇論文《From Eliza to XiaoIce:Challenges and Opportunities with Social Chatbots》。

文章不僅清晰展現了聊天機器人的歷史發展脈絡,還提出了作者對於其現狀及其未來進化方向的重要觀點。以下為DT君經過整理之後的論文主要內容:

聊天機器人的類別

1、聊天機器人系統

在過去的數十年中,會話系統的研究和發展已經走過了很長一段路。不過,受圖靈實驗的啟發,最早的聊天機器人的任務僅僅是和人類閑聊。它們是用文字或者音頻來進行電腦程序,通過模仿人類在對話中行為以通過圖靈測試。

最早被大家知道的聊天機器人是1966年誕生於MIT的Eliza。Eliza並不理解對話的內容,它只是通過模式匹配來尋找合適的回應,再進行組合。它只有非常有限的知識,因此只能與特定領域的人進行「交談」。

其後的同類聊天機器人,不論是可以模仿交談者情緒的Parry還是三次贏得Loebner Prize(最類人系統獎)的Alice,儘管這些聊天機器人都取得了不錯的成績,但是它們本質上仍然是基於手動編寫的規則,因此只能在有特定限制的環境中出色工作。

2、任務驅動對話系統

和聊天機器人系統形成鮮明對比的是,任務驅動的對話系統是為完成特定任務而設計。這些系統通常在非常特定的領域應用。如用於訂購機票的ATIS,它可以理解用自然語言表述的請求,比如查閱航班信息,並作出回應。

任務驅動對話系統一般包括一個自動語音識別器(ASR),一個口語理解(SLU)模塊,一個對話管理器(DM),一個自然語言生成器(NLG)和一個文本語音轉換器(TTS)。目前這一領域的研究更多集中在如何對整個系統進行端到端的整體優化。

3、智能私人助手

自從2011年蘋果推出Siri,各個公司都開始推出自己的IPAs——微軟的Cortana,谷歌的Google Assistant,Facebook的M,Amazon的Alexa,等等。IPAs從不同的感測器獲得包括位置,時間,運動,手勢等信息。同時,它也可以接觸類型多樣的龐大數據源,比如音樂,電影,日曆,郵件等等。因此,IPAs可以提供跨越多個領域的廣泛服務,甚至可以求助於互聯網。它不僅僅被動回答用戶的問題,也會主動進行提醒和推薦。

圖 | 餐廳推薦與交通信息提醒

4、社交機器人

智能手機的普及和無線技術的快速發展使如今成為社交媒體的時代。社交聊天機器人應運而生。不同於早期的閑聊機器人僅僅用於閑聊,社交聊天機器人需要滿足用戶對於交流,喜愛和社會歸屬感的情感需求。微軟的小冰正是開闢了這樣一個全新的領域——它們的存在不是要回答用戶的所有問題,而是可以與用戶建立情感聯繫,成為一個虛擬的陪伴。

聊天機器人的全新領域

社交聊天機器人的吸引人之處不僅在於它可以對使用者的不同請求作出回應,更在於它可以和使用者建立起情感聯繫。自2014年5月問世以來,微軟小冰已經成為應用最廣為人們熟知的社交聊天機器人。它可以理解使用者的情感需求,並在對話中作出恰當的回應,以鼓勵對話者。這些對話可以將使用者向積極樂觀的方向引導,為其提供情感支持。同時,這樣的對話也可以在使用者和機器人之間建立信任感,幫助小冰更加了解使用者,而在未來提供更好的服務。

圖 | 微軟小冰對使用者的鼓勵

1、不同的效果衡量方式

不同於閑聊機器人,能否通過圖靈測試並不能成為衡量社交機器人好壞的標準。不同於IPAs需要精確快速地回答用戶的問題,效率同樣也不能成為社交機器人的衡量標準。因此,新的衡量標準CPS(平均每次會話的對話次數)被提出。社交機器人是的目的是讓使用者持續參與,因此CPS值越高,效果越好。事實上,利用這一參數,可以給不同的繪畫系統進行分類。

圖 | 不同對話系統的CPS值

2、IQ與EQ兼具的聊天機器人

被喜愛的情感和社會歸屬感是人類的基礎需求之一。因此,讓聊天機器人來滿足這樣的需求對於我們的社會就具有極其重大的價值。而為了滿足這樣的需求,社交機器人必須具有同情心,社交技巧,個性和一定的情商和智商。

同情心使它們可以理解用戶。它們需要從對話中確定出用戶的情感,並隨著時間的推移來關注這種情感的發展,以理解用戶的情感需求。對上下文信息進行合理的建模應用以及常識的儲備都是十分重要的。

一個社交機器人也需要表現出相對穩定的個性,這樣它才能從用戶那裡獲得信任,讓用戶對談話預設合理的期望。這裡所說的個性包括年齡,性別,語言,講話方式,態度傾向,知識水平,專業領域和一個合適的聲音。同樣,這些也需要不斷從對話中學習,改進。

社交機器人需要擁有廣泛的技巧來完成特定的任務。它們需要分析用戶的請求並生成回復——是回答問題還是採取其它措施。IQ包括知識和存儲模型。IQ不僅是多種多樣技巧的基礎,更是高EQ的基礎。得到的結果需要被表示為對話這易於理解的形式。除此之外,它們還需要有能力開啟新的話題。為了更有效的和使用者溝通,微軟小冰不僅可以使用文字,還可以發送圖片,語音等。

圖 | IQ與EQ結合生成對話結果

3、整體架構

首先,系統有一個由多模型介面來接受用戶輸入——文字,圖片或聲音。然後,chat manager會將輸入調度給不同的模塊,來理解輸入和生成輸出。最後,chat manager會整合生成的結果來生成最終的輸出。

圖 | 整體架構圖

Core-chat是社交機器人的核心模塊,它接受文本輸入並生成文本輸出。它為系統提供了交流能力。它利用上下文信息來理解對話內容,同時偵測其中的情感信息,並以此推測用戶的情感狀態。為了更好的理解用戶的特點和情感狀態,它會為每一個客戶保存一個概況,保存該用戶的基本信息。而為了擁有常識知識,它可以利用Freebase和Microsoft Concept Graph。

輸出的生成方式主要有兩種——基於檢索和基於生成的。前者將首先從存儲人類對話中消息回復對的資料庫中構建索引。而後者最近由於深度神經網路的利用取得了極大的進步。它通過編碼——解碼的神經網路,藉助LSTM網路生成結果。

社交機器人還需要理解圖片,因為它們經常在社交中被應用。除了識別物體,描述圖片內容,社交機器人的評論還需要能夠反映個人的心情,情感和態度。Visual Sense同樣有基於檢索和生成兩種方法。前者藉助卷積神經網路,後者則將其轉化為一個圖片到語言的生成問題。

圖 | 對圖片內容進行識別,描述,形成有個性的評論

微軟小冰的未來

自小冰在中國的微信與微博與大家見面後,它已經成為了互聯網的名人。新聞編輯,主持電視和電台節目無所不能。2015年,微軟小冰登陸日本,2016年在美國與大家見面,2017年來到印度和印度尼西亞。在過去的三年中,小冰一直在進行技術更新,在中國的CPS逐年增長。微軟小冰還可以生成更為複雜的表達,比如根據給定的圖片寫詩。在2017年5月15日,它發行了歷史上第一本AI詩集,並在多本嚴肅的詩歌刊物上發表詩歌70餘首,其能力得到了充分肯定。

圖 | 微軟小冰在中國應用中逐漸上升的CPS值

儘管以微軟小冰的代表的社交機器人已經是神通廣大,但是人類級別的智能,就像在人類間對話中頻繁體現的那種水平,還遠沒達到。讓機器可以理解人類的語言仍舊是人工智慧領域一個基本的挑戰。這需要在多個領域,尤其是人工智慧意識和認知方面的重大突破。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

2017 年專利大數據分析出爐!IBM 連續領跑 25 年

TAG:DeepTech深科技 |