當前位置:
首頁 > 科技 > 機器人會還價?Facebook教機器與人類談判

機器人會還價?Facebook教機器與人類談判

機器人會還價?Facebook教機器與人類談判

儘管與蘋果、微軟和亞馬遜相比,Facebook在人工智慧對話方面成績並不顯著,但最近該公司也對智能對話系統產生了濃厚興趣並為此發表相關文章。

隨著Siri、Cortana和Alexa的出現,進軍智能對話越來越困難,如今智能對話需要的再也不僅僅是靠良好的語音識別來給用戶帶來極致體驗了。在這一過程中,Facebook一直在不斷改進機器對自然語言的理解和文本生成方面的問題。今天,Facebook人工智慧研究團隊在其投資組合中發表了一篇論文,將談判引入到對話中。Facebook的團隊把遊戲理論與深度學習結合起來,讓機器與人類進行談判。通過把在遊戲場景中更常用的技術運用在對話機器中,Facebook就能夠創造出能夠進行複雜談判的機器。

首先,該程序要構想出一個虛擬的談判場景。例如:亞馬遜的土耳其機器人就曾經被賦予了一個明確的價值函數,然後要求該機器人用自然語言與人類進行談判,通過把一些隨機物品進行分割來獲得最大獎勵(獎勵包括五本書、三頂帽子和兩個球)。遊戲被限定在10輪對話框中,規則規定,如果超過10輪那就沒人能得到任何獎勵。因為每個人都有明顯的隱藏偏好,所以必須進行對話,以找出應該給哪個人提供哪些物品。在互動過程中,機器自然而然地採用了許多常見的談判策略,比如說把重點放在一個價值較低的項目上,試圖把它作為一個更有價值的談判籌碼來誤導人類。

Facebook的新技術以一種決策樹的形式出現。決策樹是許多智能系統的關鍵組成部分。它可以讓人們從現在來為未來的事情進行建模並做出決策。想像一下,就像在井字棋這樣的遊戲中,任何一個特定點上都有一種遊戲規則,有一個有限的選項集。在這種情況下,每一步都有一個預期值。人類通常不會以一種明確的方式來考慮這個值,但是如果有人在玩遊戲的時候分解了整個決策過程,實際上他就是在腦子裡進行了整個數學計算。像井字棋這樣的遊戲非常簡單,可以在決策樹中完全解決。還有更複雜的遊戲如象棋,需要運用策略來減少步數,但是這在現實生活中幾乎不可能實現。但即使是這樣,相比較對話來說,國際象棋和圍棋也是屬於簡單的。

機器人會還價?Facebook教機器與人類談判

對話不是從有限的結果中得出的。這意味著,對於任何問題,都有無數可能的人類反應。為了模擬談話,研究人員必須付出難以想像的努力,把不確定的問題確定在合理的規模和範圍之內。選擇一種談判模式,這是可能的。語言本身可以存在無限多種表達方式,但其意圖通常是表達一些簡單的結果,比如:我想接受或拒絕它。但即使是在一個有界的世界裡,要讓機器以一種可信的方式與人類互動還是很困難的。為了達到這一效果,Facebook在兩個人之間的談判中訓練了自己的模型。一旦完成這一任務,機器就可以通過強化學習來進行談判。在每一輪談話結束時,代理人員都獲得了獎勵,以指導和改進工作。

研究人員邁克爾·劉易斯和Dhruv Batra解釋說,他們的演算法既可以幫助人類確保其作出最好的決定,也可以防止個人做出錯誤決定,並且在後者做得更好。這一點非常重要,想像一下,一個日曆應用程序,它不會去安排會議,讓會議在每個人的最佳時間進行,而它做的是設法確保會議能夠順利開展。

但是和大量的研究一樣,這項技術的應用並不像論文中模擬的那樣明確。工程師們常常利用機器之間的敵對關係來改善成果,比如利用建立敵對網路來生成培訓數據,讓機器生成數據,讓另一台「守門人」機器來學習。這種半合作半敵對的關係,就像教練和運動員之間的關係,能進一步連接遊戲理論和機器學習。Facebook已經開發了這項研究項目的代碼。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 電腦報APP新聞客戶端 的精彩文章:

BestBuy榜單,微邊框筆記本推薦榜
iPad Pro部分任務性能超越MacBook Pro
[視頻]10.5英寸iPad Pro拆解:推薦買個保護套
拒絕被忽悠!618大屏電視終極選購秘籍
Google:Backup and Sync將於6月28日登陸Mac和Windows

TAG:電腦報APP新聞客戶端 |

您可能感興趣

揭秘MIT-IBM Watson AI,如何教機器識別行為
首款可移動智能AI早教機器人 蘿小逗評測
讓 AI 教機器自己玩俄羅斯方塊
如何讓AI教機器自己玩俄羅斯方塊?
研究人員剛剛教機器人來預測你的一舉一動!
英偉達打算教機器人通過觀察人類來學習
教機器遺忘或許比學習更重要:讓AI健忘的三種方式
AI 如何幫你高效率找工作,領英說和教機器識別一隻貓沒區別
科學家教機器如何分析獨特的亞原子「湯」模擬
英偉達教機器人通過觀察人類行為來完成簡單任務
不同於暴力的波士頓動力,這個團隊教機器人聽音樂,學習伴舞
早教機器人發展將成為新時代兒童生活的一部分
加州大學伯克利分校最新研究,教機器人學會 「摸物辨形」
深度:早教機器人今年要火!服務機器人將遭大清洗
歌唱故事唐詩英文全都會,試試早教機器人
家長必備家教機器人推薦:款款精品
讀繪本、陪學習,推薦五款孩子視為「夥伴」的早教機器人
早教機器人湧入新風口 核心技術成取勝關鍵
和孩子一起認識世界酷比魔方酷仔早教機器人評測
陪孩子一起認識世界,酷比魔方酷寶早教機器人評測