自然語言處理論文推薦11篇

知識 12-21

自然語言處理論文推薦11篇

1、Building Large Machine Reading-Comprehension Datasets using Paragraph Vectors

【機器閱讀理解】【數據福利】本文利用一種無監督的方法構建了一組大型的機器閱讀理解數據集。其中機器閱讀理解問題是提供一篇新聞，從5個候選標題中選擇一個正確的。無監督的方法用了Mikolov提出的Paragraph Vector（Word2Vec的文檔版），用來訓練和計算各個新聞標題之間的相似度，產生候選答案。本文所生成的數據集地址：https://github.com/google/mcafp

2、Multi-Perspective Context Matching for Machine Comprehension

【機器閱讀理解】本文的研究基於SQuAD數據集，提出了一個端到端訓練模型，主要的思路是passage中與問題相似的span更加傾向於是正確答案。SQuAD是這個領域中有名的數據集，相應的模型很多，本文的結果相對一般。

3、ConceptNet 5.5: An Open Multilingual Graph of General Knowledge

【知識圖譜】【資源推薦】本文介紹了一個通用知識圖譜ConceptNet 5.5，圖譜主頁的地址：http://conceptnet.io/相關的code和文檔地址：https://github.com/commonsense/conceptnet5

4、Tracking the World State with Recurrent Entity Networks

【Dynamic Memory】本文介紹了一種新的模型，Recurrent Entity Network (EntNet)，引用外部動態長程記憶來做推理，並在 SYNTHETIC WORLD MODEL、bAbI和CBT三個任務上得到了驗證，值得關注。本文工作來自FB LeCun組。

5、Online Sequence-to-Sequence Reinforcement Learning for Open-Domain Conversational Agents

【對話系統】用幾個關鍵詞來概括一下本文的工作：1、在線訓練；2、seq2seq；3、深度增強學習；4、開放域問題。建議對對話系統感興趣的童鞋研讀。

6、Neural Emoji Recommendation in Dialogue Systems

【對話系統】【Emoji】Emoji表情是大家在平時聊天時經常會用到的，往往一個表情勝過一句話的表達。本文研究了在多輪對話中如何通過上下文來預測和推薦emoji表情，是個很好玩的工作。如果能夠分析和預測更廣泛的表情包（不僅限於emoji）的話，可能是件更好玩的事情。

7、Learning Through Dialogue Interactions

【對話系統】Jiwei Li的新文章，通過和Teacher的交互（基於知識庫相互問和答）來提高bot的學習能力，整體框架仍是增強學習，值得精讀。代碼和數據都已開放，地址：https://github.com/facebook/MemNN/tree/master/AskingQuestionstorch實現。

8、Diverse Beam Search: Decoding Diverse Solutions from Neural Sequence Models

【seq2seq多樣性】【柱搜索】一篇考慮了生成內容多樣性的beam search改進演算法，可以應用在chatbot、nmt、image caption、vqa等各種場景中。開源代碼用torch實現的，基於neuraltalk2代碼。地址：https://github.com/ashwinkalyan/dbs在線demo地址：http://dbs.cloudcv.org/captioning

9、Multilingual Word Embeddings using Multigraphs

【詞向量】本文給了一組單語和多語的詞向量學習方法，基於SkipGram模型，skipgram的context考慮比較簡單，本文主要是在context上做了一些文章，添加了一些特徵，比如syntactic dependencies and word alignments等。

10、FastText.zip: Compressing text classification models

【模型壓縮】模型過大是DL的一個問題，尤其是在部署模型時，這個問題尤其明顯。本文工作來自FB，是開源分類工具fasttext的一個模型壓縮版。FastText的地址：https://github.com/facebookresearch/fastText

11、Mining Compatible/Incompatible Entities from Question and Answering via Yes/No Answer Classification using Distant Label Expansion

【評論挖掘】本文針對的應用場景是從商品評論中挖掘各種商品的兼容性，比如買了個滑鼠，想知道這個滑鼠和ipad、pc的兼容性如何。文中的Complementary Entity Recognition 方法來自上周同作者的一篇文章，地址是https://arxiv.org/abs/1612.01039這個應用場景比較接地氣，建議對評論挖掘感興趣的童鞋閱讀。

請您繼續閱讀更多來自 科研圈 的精彩文章:

※浙江大學李達三·葉耀珍幹細胞與再生醫學研究中心陳曉課題組博士後招聘
※交談時很難保持眼神接觸？——你不是一個人
※安全高效的無鉛太陽能電池

TAG:科研圈 |

您可能感興趣

※自然語言處理論文10篇
※自然語言處理論文筆記
※自然語言處理領域論文筆記
※ACL2017中國研究論文解讀：讀懂中國自然語言處理前沿進展
※ACL 2017中國研究論文解讀：讀懂中國自然語言處理前沿進展
※107篇論文被撤：有作者稱對論文撰寫投稿並不知情
※自然語言處理領域歐洲頂級會議EACL 2017傑出論文出爐
※107篇論文被撤：有通訊作者稱對論文撰寫投稿並不知情
※推薦一組關於「非真」信息的論文及《現代傳播》2016年第7期
※發表超過1450篇論文的怪才——「論文合作之王」
※資源：自然語言處理數據集、語料庫和論文集合
※計算語言頂會ACL 2017開幕在即：國內接收論文梳理（5篇傑出論文）
※117篇撤稿論文，61份學術不端通報：「無賴性論文造假」太荒唐
※自然語言處理領域的前沿技術：EMNLP 2017最佳論文公布
※2016十大論文撤稿事件：學術界的醜聞與自凈
※2016 十大論文撤稿事件：學術界的醜聞與自凈
※五部門通報107篇論文被撤稿：涉521名作者，正甄別處理
※論文快遞員——第32期：超材料論文摘要精選
※英語論文格式