當前位置:
首頁 > 最新 > ACL2017-基於神經網路方法的多文檔摘要

ACL2017-基於神經網路方法的多文檔摘要

一,問題

已有的新聞語料,為sentence-to-sentence模型在單文檔摘要中的應用奠定基礎。然而,針對多文檔摘要,缺少相應大規模的用於複雜模型參數估計的語料。本文作者提出一種基於句子的方法,對句子重要度進行回歸分析,然後基於句子重要度的排名得到相應的摘要。

二,方法介紹

本文的一個重要創新之處在於,利用句子之間的關係圖,對句子向量進行優化。針對一個cluster中的多個篇章而言,每個篇章包含多個句子。

首先,每個句子的結構用RNN模型來捕捉,得到相應的句子向量。

圖的構建:對於同一個cluster下,句子之間的關係(邊的權重)通過三種方法衡量,利用tf-idf計算相似度,Approximate Discourse Graph,為了進一步增加變異性,作者提出sentence personalization score。

在圖構建完之後,使用Kipf and Welling (2017)提出的Graph Convolutional Networks,最終輸出,針對每個節點(句子)的隱藏特徵,即考慮到篇章結構的句子向量。

每個篇章,繼續使用rnn模型構建篇章的向量表示。

最後,針對每個cluster,篇章的平均最為cluster向量表示。

最終的句子重要度估計如下式所示:


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 SoulInRobot 的精彩文章:

TAG:SoulInRobot |