自然語言處理論文10篇

知識 01-15

自然語言處理論文10篇

1、Neural Personalized Response Generation as Domain Adaptation

【個性化】【對話生成】本文研究的問題是如何生成個性化的對話，模型仍是基於經典的seq2seq+attention，在該模型的基礎上通過兩個步驟來生成特定style的對話，第一步是initialization，第二步是adaptation。工作來自哈工大 @劉挺老師組，他們推出了一個聊天機器人「笨笨」（可微信搜），而且具有中文閱讀理解的功能。關於生成更多樣的對話內容，可以參考PaperWeekly 第十八期 --- 提高seq2seq方法所生成對話的流暢度和多樣性

2、RUBER: An Unsupervised Method for Automatic Evaluation of Open-Domain Dialog Systems

【對話系統】【評價】本文研究的問題也是當前對話系統中非常關鍵的一個問題，如何更加準確地自動評價模型的效果，本文提出了一種新的評價方法RUBER，旨在通過生成的reply和用戶的當前query來聯合評判效果，建議從業者和相關研究人員精讀。

3、Generating Long and Diverse Responses with Neural Conversation Models

【對話生成】【seq2seq】本文研究的問題是如何生成一個又長、又多樣的對話，模型仍是基於經典的seq2seq，在decoding部分，加了一個所謂的self-attention部件來保證對話長度和連貫性，在解空間中用隨機beam search來搜索候選對話，然後進行重排得到最終結果。

4、Decoding as Continuous Optimization in Neural Machine Translation

【seq2seq】【解碼】本文的亮點在於將seq2seq模型中的解碼部分轉化成一個連續優化的問題，通過比較成熟的優化演算法來解決解碼問題，這個思路可以被應用到所有seq2seq解決方案中。

5、OpenNMT: Open-Source Toolkit for Neural Machine Translation

【NMT】【開源】 Harvard NLP組和SYSTRAN公司聯合推出的開源機器翻譯系統OpenNMT，torch實現，代碼地址：https://github.com/opennmt/opennmt主頁地址：http://opennmt.net/

6、Implicitly Incorporating Morphological Information into Word Embedding

【詞向量】將詞形信息考慮在詞向量模型中是一種常見的增強手段，一般的做法是將詞的前綴、後綴和詞根作為獨立的token進行建模，而本文的思路則是用能夠代表前綴、後綴意思的詞來代替進行建模。

7、Real Multi-Sense or Pseudo Multi-Sense: An Approach to Improve Word Representation

【真假多義詞】詞向量是一個非常活躍的研究領域，word2vec提供了一種非常簡單粗暴、充滿問題的詞向量，比如一個典型的問題是一詞多義，於是很多的工作都是在解決一詞多義的問題，但一個詞對應的多個向量其實都指向同一個詞義，本文的工作正是對這些偽一詞多義進行識別，降低語言研究的複雜度。

8、Multi-level Representations for Fine-Grained Typing of Knowledge Base Entities

【entity表示】 entity是知識圖譜的基礎組件，很多的entity都是罕見詞（短語），entity的表示是一個相對困難的問題。本文提出了一種char-level、word-level和entity-level三種level的聯合表示模型，得到了不錯的效果。本文非常值得精讀！數據和代碼都已公開http://cistern.cis.lmu.de/figment/

9、Task-Specific Attentive Pooling of Phrase Alignments Contributes to Sentence Matching

【短語對齊】本文研究的問題是句子匹配，該問題常常被應用於文本蘊含和答案選擇兩個任務上，針對短語識別、表示和對齊等關鍵問題，本文提出了一種基於GRU的NN模型，取得了不錯的效果。本文作者是@Wenpeng_Yin

10、Parsing Universal Dependencies without training

【依存分析】【無監督】本文的工作是基於pagerank和一些規則來做無監督式的依存文法分析，無監督的paper總是讓人眼前一亮，EACL2017。」在現今去規則化和拼語料庫的機器學習型parser盛行時，少有的使用規則，無監督的Parser。每人研究都有自己支撐點，在沒有被完全推翻時，自然會堅持，不為熱潮激流所動，我認為這是理性研究者的主骨，我一直有敬畏之心。儘管各家學說各異，相信還是以結果優良和可發展性為最終評價標準」(觀點來自微博王偉DL)

掃碼下載所有paper pdf

您的贊是小編持續努力的最大動力，動動手指贊一下吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 科研圈 的精彩文章:

※本周「來聊」精選，看到年輕人的灼熱目光
※Science 等一周論文導讀（下）
※多模態機器翻譯論文推薦
※Science 等一周論文導讀（上）
※華中師範大學化學生物學研究中心研究助理招聘

TAG:科研圈 |

您可能感興趣