微軟研究院主管Eric Horvitz：我們決定讓AI理解幽默

知識 01-12

選自arXiv

作者：Robert West、Eric Horvitz

機器之心編譯

很多人都嘗試過調戲小冰、Siri 等 AI 助手，並獲得過令人捧腹的回答，但當你用一本正經的語氣開始諷刺的時候，人工智慧就無法理解了。事實上，有些研究者認為無法理解幽默感是人工智慧與人類在自然交互上面臨的最大障礙。微軟研究院運營主管 Eric Horvitz 和瑞士聯邦理工助理教授 Robert West 最近決定通過一個在線遊戲來構建語料庫，徹底解決讓計算機理解幽默的問題，該研究的論文目前正在被 AAAI 2019 審閱。

幽默是人類獨有的特質，在日常生活中扮演著至關重要的作用。心理學家指出幽默在人類認知中發揮重要作用，包括它與學習、解決問題過程的驚人聯繫，以及幽默在社會參與中的重要性（Martin 2010）。幽默是智能及其自動化研究中的一個頗有前景的領域：我們難以想像一台計算機可以通過圖靈測試，卻無法理解和產生幽默。

隨著計算機越來越多地接手對話任務（如聊天機器人和個人助手），與用戶進行自然交互的能力變得越發重要，但自然的人機交互必須在在人類可以幽默——同時也能被計算機理解的情況下才算形成。最近的研究表明，AI 系統對於嘲弄的誤解可能是開放互動失敗的根源（Andrist et al. 2016）。

幽默與人類的關係如何？解釋這種現象一直是很多最偉大的思想家面臨的挑戰，研究幽默已是 20 多個學科的研究主題了（Raskin 2008），其中也包括計算機科學（Binsted et al. 2006），研究人員已經開發了用於檢測、分析和生成幽默語句的演算法。

幽默的自動分析頗為複雜，因為大多數幽默文本具有難以理清的複雜敘事結構；例如，典型的笑話——文獻中研究最多的幽默文本類型，小心地「布置舞台」，給觀眾建立某些期望，然後抖包袱顛倒期望（如，你以為有錢人像你想像的一樣快樂嗎？你錯了！有錢人的快樂你想像不到！）。為了規避敘事結構帶來的困難，本研究選擇了一種特定的幽默體裁：諷刺新聞。諷刺性新聞表面上模仿了主流新聞的典型形式，但與嚴肅性新聞不同，它的目的不在於關聯事實，而是嘲笑個體、群體或社會。而且更重要的是，諷刺性新聞往往首先從標題體現出來：只有標題本身有趣，故事的其餘部分才會徐徐展開（Glass 2008）。這明顯不同於真實的新聞報道，這也意味著諷刺性新聞的標題可以與正文分開研究，而標題的表達形式簡潔，敘事結構最少。

諷刺標題的另外一個優勢是它們模仿了嚴肅性新聞標題的公式化風格，這限制了它們的句法可變性，使我們能夠更好地控制句法，並將重點放在語義上。此外，諷刺標題不僅在風格上與嚴肅性新聞標題類似，內容上也有相似之處：僅僅改變一個詞就足以讓一個諷刺標題聽起來像嚴肅新聞。

運行示例。例如，將諷刺標題 God diagnosed with bipolar disorder（上帝被診斷患有躁鬱症）改成 Bob Dylan diagnosed with bipolar disorder（Bob Dylan 被診斷患有躁鬱症），那麼原本應該出現在洋蔥新聞上的文章就可以出現在嚴肅報刊上了。

此類諷刺標題與對應的嚴肅標題對組成的大型語料庫將為幽默研究開啟新的可能性。例如，我們可以通過查看造成這對標題屬性不同（嚴肅 vs 幽默）的具體單詞，來更加細粒度地理解諷刺性文本的幽默之處。這是與之前研究的最大不同，之前的研究通常將平均諷刺標題與平均嚴肅標題進行對比 (Mihalcea and Pulman 2007)。此外，儘管本研究的主要目標是獲取對幽默的新見解，但是研究者還設想了一些新應用。例如，如果我們準確把握諷刺標題與嚴肅標題之間的區別，那麼我們或許可以創建一個流程，用少許的改動將真實的新聞標題改成諷刺性標題。

要想創建對齊資料庫，我們的第一個想法是將諷刺性新聞標題與嚴肅性新聞標題自動配對：從諷刺標題開始，找到幾乎同時間寫成的最類似的嚴肅標題。很難想像這個流程能獲得很多具備高度辭彙和句法相似度的標題對。另一個思路是眾包：向眾包人員展示嚴肅的標題，然後讓他們通過微小改動將其改成諷刺標題。不過，該任務需要創新性思維，這並非人人擁有。即使是美國最著名的諷刺報刊《洋蔥新聞》，每周生成的 600 個標題中也只有 16 個（小於 3%）被接受 (Glass 2008)。

一個關鍵的觀察結果是如果把這個任務反過來會簡單很多：只需微小改動即可直接去除諷刺標題中的幽默感，將標題變成看起來比較嚴肅的句子。也就是說，將別人費心寫就的幽默標題轉換成嚴肅版本所需的創造力遠遠少於向標題中添加幽默感。因此研究者採用了反向眾包方法，設計了一個遊戲 Unfun.me，如圖 1 所示。該遊戲給出諷刺性新聞標題 h，要求遊戲玩家 A 修改標題，讓其他選手認為修改結果 h" 是真實的嚴肅新聞標題。如果其他選手判斷修改結果 h" 是嚴肅標題，則玩家 A 得到的獎勵 R_A(h,h") 將上升，反之則獎勵下降。

圖 1. Unfun.me，用於構建諷刺-嚴肅標題對 (h,h") 語料庫的遊戲。圖中數字表示任務的步驟。截圖中為運行示例（h = God diagnosed with bipolar disorder；h" = Bob Dylan diagnosed with bipolar disorder；g = Obama elected president）。

圖 2：(a) 通過 Unfun.me 收集的標題對中基於 token 的編輯距離的分布。(b) 編輯距離和嚴肅性評級權衡。(c) 基於 token 的編輯操作分布（僅成功的標題對）。(d) 基於語塊的編輯距離分布（僅成功的標題對）。

該研究的貢獻有兩部分。首先，該研究引入了收集諷刺性新聞標題和嚴肅性新聞標題對語料庫的在線遊戲 Unfun.me。其次，該研究對這些標題對的分析更加細粒度地揭示了諷刺性標題的關鍵屬性，這是之前研究所不具備的。

論文：Reverse-Engineering Satire, or「Paper on Computational Humor Accepted Despite Making Serious Advances」

論文鏈接：https://arxiv.org/abs/1901.03253

摘要：幽默是人類的一個基本特徵。要理解幽默，首先得理解幽默和認知基礎之間的聯繫，以及幽默在社交過程中的重要性。因此，它是一個與人工智慧和人機交互相關的有前景的重要研究課題。以前關於幽默的計算研究主要是以粗粒度水平進行的，如，預測整個句子、段落或文檔等是否幽默。本文的目的是對幽默進行深入理解，因此我們追求的是能使給定文本變得幽默的細粒度模型。我們先從觀察開始，發現諷刺性新聞的標題往往與嚴肅性新聞的標題類似，接著我們建立並分析了一個包含諷刺性新聞標題和嚴肅性新聞標題的語料庫，其中兩種新聞標題是兩兩成對且近乎一致的。該語料庫是通過在線遊戲——Unfun.me 構建的，它鼓勵玩家對諷刺性新聞的標題進行最小幅度的修改，以使另一個玩家相信這是嚴肅性新聞的標題。對諷刺性新聞標題的修改成功去除了幽默成分，因為它精準定位了標題中使原諷刺標題變得有趣的關鍵詞和概念。我們的分析表明，幽默成分通常在標題的末尾部分，主要是名詞短語，且大多數諷刺標題會遵循某種邏輯模式，我們稱之為虛假類比（false analogy）。總體來說，本文加深了我們對諷刺性新聞標題句法和語義結構的理解，並為構建幽默生成系統提供了一定的見解。

表 2：句法塊類型在單替換對中的分布（僅顯示至少修改一次的類型）。

圖 3：修改後的塊位置在單替換對中的分布，用於包含 3 到 6 個塊的原始標題（每種長度的對數：24, 38, 123, 38）

表 4：虛假類比標題示例。

本文為機器之心編譯，轉載請聯繫本公眾號獲得授權。

------------------------------------------------

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器之心 的精彩文章:

※AI用你的臉生成假視頻，你卻不能刪除
※PyTorch 1.0 正式版發布了！

TAG:機器之心 |