當前位置:
首頁 > 最新 > 基於深度卷積網路進行諷刺檢測

基於深度卷積網路進行諷刺檢測

作者:Elvis Saravia

編譯:weakish

編者按:NTU研究人員Soujanya Poria等提出了一個組合模型,基於預訓練的卷積神經網路提取情感、情緒、個性特徵,以進行諷刺檢測。NTHU PhD學生Elvis Saravia簡明扼要地總結了論文的主要思路。

概覽

這篇論文使用基於卷積神經網路(CNN)的組合模型處理NLP任務諷刺檢測(sarcasm detection)。諷刺檢測對情感檢測和情感分析等領域而言十分重要,因為這一表達將翻轉句子的極性。

例子

挑戰

理解和檢測諷刺很重要的一點就是理解關於事件的事實。這讓我們可以檢測客觀極性(通常是負面的)和作者的諷刺特徵(通常是正面的)之間的反差。

考慮以下例子,「我愛分手之苦」,很難從中提取檢測其中是否存在諷刺的知識。例子中的「我愛其苦」提供了作者表達的情感的知識(在這個例子中是正面的),而「分手」描述了一個相反的情感(負面)。

諷刺語句中的其他挑戰包括指代多個事件,以及提取大量事實、常識、指代解析、邏輯推理。論文的作者依靠CNN從諷刺語料庫中自動學習特徵。

貢獻

將深度學習應用於諷刺檢測

利用用戶簡介、情緒、情感特徵進行諷刺檢測

應用預訓練模型自動提取特徵

模型

情感轉移(sentiment shifting)在牽涉諷刺的交流中很常見。因此,論文作者首先訓練基於CNN訓練一個情感模型學習情感特定的特徵提取。模型在低層學習局部特徵,之後在高層轉換為全局特徵。作者發現諷刺表達和用戶相關——某些用戶比其他用戶發布更多諷刺性內容。

作者提出的框架整合了基於用戶個性的特徵,情感特徵,基於情緒的特徵。每組特徵通過獨立的模型學習,成為從數據集中提取諷刺相關特徵的預訓練模型。

CNN框架

CNN能夠有效地建模局部特徵以學習更全局的特徵,本質上,這是在學習上下文(learn context)。句子使用詞向量(嵌入)表示(基於Google的word2vec向量)。使用了非靜態表示,因此,詞向量的參數在訓練階段學習。接著,在特徵映射上應用最大池化,以生成特徵。然後是softmax層及全連接層,以輸出最終預測。(見下圖)

為了得到其他特徵——情感(S)、情緒(E)、個性(P)——預訓練了CNN模型,並使用這些預訓練模型從諷刺數據集中提取特徵。訓練每個模型使用了不同的訓練數據集。(參考論文了解更多細節)

測試了兩個分類器——一個CNN分類器(CNN)和一個SVM分類器(CNN-SVM,使用CNN提取的特徵作為輸入)。

另外還訓練了一個基線分類器(B)——僅僅使用CNN模型,沒有結合其他模型(情緒、情感等)。

試驗

數據為均衡和失衡的諷刺推文數據集,取自Ptacek等2014年的工作和The Sarcasm Detector。移除了用戶名、URL、標記,使用了NLTK Twitter Tokenizer。(參考論文了解更多細節)

下表顯示了CNN和CNN-SVM分類器的表現。我們可以觀測到結合了諷刺特徵、情感特徵、情緒特徵、個性特徵的模型(特別是CNN-SVM)的表現超過了其他模型。

B = 基線,S = 情感,E = 情緒, P = 個性。所有試驗使用了五折交叉驗證

下表則是與當前最先進模型(第一行)和另一個知名的諷刺檢測模型(第二行)的比較。同樣,論文提出的模型的表現超過了其他模型。

D3 => D1意為在數據集3上訓練,在數據集1上測試

論文測試了模型的概括能力,主要的發現是如果數據集本質上很不相同,會顯著影響結果。(見下圖基於PCA可視化的數據集)。例如,在數據集1上訓練,然後在數據集3上測試,模型的F1評分為33.05%.

結論

總體而言,論文作者發現諷刺高度依賴主題,並且高度上下文相關。因此,情感和其他上下文線索有助於從文本中檢測諷刺。使用預訓練的情感、情緒、個性模型從文本中捕捉上下文信息。

手工構造的特徵(例如,n元語法),儘管某種程度上有助於諷刺檢測,會產生非常稀疏的特徵向量表示。因此,使用詞嵌入作為輸入特徵。

參考

A Deeper Look into Sarcastic Tweets Using Deep Convolutional Neural Networks:https://arxiv.org/abs/1610.08815

Reddit上關於本文的一些討論:https://www.reddit.com/r/MachineLearning/comments/8fzkwc/r_detecting_sarcasm_with_deep_convolutional/


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 論智 的精彩文章:

基於安全多方計算協議實現私密深度學習模型
基於Numpy實現神經網路:反向傳播

TAG:論智 |