句法分析（syntactic parsing）在NLP領域的應用是怎樣的

知識 10-22

句法分析（syntactic parsing）在NLP領域的應用是怎樣的？

文章整理自郭江師兄問題回答（被收錄於知乎編輯推薦）！已取得師兄授權！@jiangfeng

原問題如下：

opinion extraction system，information retrieval system是如何通過syntactic parsing實現的？

解答如下：

這裡面有兩個問題：1. 在opinion extraction/IR中如何使用句法分析；

2. 句法分析在多大程度上對這兩個任務有幫助（原題）。

由於我自己主要還是做句法分析本身，暫時很少做上層應用，所以簡單談談我對應用的理解，拋磚引玉。

1、在opinion extraction/IR中如何使用句法分析。

舉幾個例子吧。

比如在opinion extraction中我們常常要抽取評價對象（aspect）：

例：「知乎的內容質量很好」

這裡「很好」形容的是「內容質量」。通過依存句法分析，就可以抽取出對應的搭配。如下圖

（順手插個廣告，分析結果來自我們實驗室的語言云：在線演示 | 語言云（語言技術平台雲 LTP-Cloud））

再說說IR，以百度框計算為例。對於以下兩個query：

Query 1: 謝霆鋒的兒子是誰？

Query 2: 謝霆鋒是誰的兒子？

這兩個Query的bag-of-words完全一致，如果不考慮其語法結構，很難直接給用戶返回正確的結果。

類似的例子還有很多。在這種情況下，通過句法分析，我們就能夠知道用戶詢問的真正對象是什麼。

推而廣之，對Query進行更general的需求分析大都離不開描述對象的提取，很多時候句法結構非常關鍵，更是下一步語義分析的前提。

2、句法分析在多大程度上對這兩個任務有幫助（原題）。

原問題很好，可以擴展出很多思考。在煉丹紀到來之前，也許我們可以給一個非常樂觀的回答，比如60%。但是現如今，我們需要思慮再三。主要原因在於，RNN/LSTM等強大的時序模型（sequential modeling）能夠在一定程度上刻畫句子的隱含語法結構。

儘管我們暫時無法提供一個清晰的解釋，但是它在很多任務上的確表現出非常promising的性能。

推薦一下車萬翔老師前段時間寫的一個簡單的survey：哈工大車萬翔：自然語言處理中的深度學習模型是否依賴於樹結構？（google一下就有）

文中的一個性能對比能夠說明問題：Tree-LSTM是基於句法結構之上的LSTM，Bi-LSTM則是簡單的雙向（left<->right）LSTM。

在很多任務上，Bi-LSTM都表現得比Tree-LSTM更好。

但是，這並不說明句法結構是沒有用的，詳細分析請參考上面提到的survey。

需要提及的是，句法分析目前的性能是防礙其實際應用的一個關鍵因素，尤其是在open-domain上。

目前在英文WSJ上的parsing性能最高能夠做到94%，但是一旦跨領域，性能甚至跌到80%以下，是達不到實際應用標準的。而中文上parsing性能則更低。

句法分析（syntactic parsing）在NLP領域的應用是怎樣的

可憐白雪曲，未遇知音人。
恓惶戎旅下，蹉跎淮海濱。
澗樹含朝雨，山鳥哢餘春。
我有一瓢酒

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 程序員小新人學習 的精彩文章: