當前位置:
首頁 > 知識 > 自然語言處理論文推薦11篇

自然語言處理論文推薦11篇

自然語言處理論文推薦11篇



1、Building Large Machine Reading-Comprehension Datasets using Paragraph Vectors

【機器閱讀理解】【數據福利】本文利用一種無監督的方法構建了一組大型的機器閱讀理解數據集。其中機器閱讀理解問題是提供一篇新聞,從5個候選標題中選擇一個正確的。無監督的方法用了Mikolov提出的Paragraph Vector(Word2Vec的文檔版),用來訓練和計算各個新聞標題之間的相似度,產生候選答案。本文所生成的數據集地址:https://github.com/google/mcafp


2、Multi-Perspective Context Matching for Machine Comprehension


【機器閱讀理解】本文的研究基於SQuAD數據集,提出了一個端到端訓練模型,主要的思路是passage中與問題相似的span更加傾向於是正確答案。SQuAD是這個領域中有名的數據集,相應的模型很多,本文的結果相對一般。


3、ConceptNet 5.5: An Open Multilingual Graph of General Knowledge

【知識圖譜】【資源推薦】本文介紹了一個通用知識圖譜ConceptNet 5.5,圖譜主頁的地址:http://conceptnet.io/相關的code和文檔地址:https://github.com/commonsense/conceptnet5


4、Tracking the World State with Recurrent Entity Networks


【Dynamic Memory】本文介紹了一種新的模型,Recurrent Entity Network (EntNet),引用外部動態長程記憶來做推理,並在 SYNTHETIC WORLD MODEL、bAbI和CBT三個任務上得到了驗證,值得關注。本文工作來自FB LeCun組。


5、Online Sequence-to-Sequence Reinforcement Learning for Open-Domain Conversational Agents


【對話系統】用幾個關鍵詞來概括一下本文的工作:1、在線訓練;2、seq2seq;3、深度增強學習;4、開放域問題。建議對對話系統感興趣的童鞋研讀。

6、Neural Emoji Recommendation in Dialogue Systems


【對話系統】【Emoji】Emoji表情是大家在平時聊天時經常會用到的,往往一個表情勝過一句話的表達。本文研究了在多輪對話中如何通過上下文來預測和推薦emoji表情,是個很好玩的工作。如果能夠分析和預測更廣泛的表情包(不僅限於emoji)的話,可能是件更好玩的事情。


7、Learning Through Dialogue Interactions


【對話系統】Jiwei Li的新文章,通過和Teacher的交互(基於知識庫相互問和答)來提高bot的學習能力,整體框架仍是增強學習,值得精讀。代碼和數據都已開放,地址:https://github.com/facebook/MemNN/tree/master/AskingQuestionstorch實現。


8、Diverse Beam Search: Decoding Diverse Solutions from Neural Sequence Models

【seq2seq多樣性】【柱搜索】一篇考慮了生成內容多樣性的beam search改進演算法,可以應用在chatbot、nmt、image caption、vqa等各種場景中。開源代碼用torch實現的,基於neuraltalk2代碼。地址:https://github.com/ashwinkalyan/dbs在線demo地址:http://dbs.cloudcv.org/captioning


9、Multilingual Word Embeddings using Multigraphs


【詞向量】本文給了一組單語和多語的詞向量學習方法,基於SkipGram模型,skipgram的context考慮比較簡單,本文主要是在context上做了一些文章,添加了一些特徵,比如syntactic dependencies and word alignments等。


10、FastText.zip: Compressing text classification models

【模型壓縮】模型過大是DL的一個問題,尤其是在部署模型時,這個問題尤其明顯。本文工作來自FB,是開源分類工具fasttext的一個模型壓縮版。FastText的地址:https://github.com/facebookresearch/fastText


11、Mining Compatible/Incompatible Entities from Question and Answering via Yes/No Answer Classification using Distant Label Expansion


【評論挖掘】本文針對的應用場景是從商品評論中挖掘各種商品的兼容性,比如買了個滑鼠,想知道這個滑鼠和ipad、pc的兼容性如何。文中的Complementary Entity Recognition 方法來自上周同作者的一篇文章,地址是https://arxiv.org/abs/1612.01039這個應用場景比較接地氣,建議對評論挖掘感興趣的童鞋閱讀。


請您繼續閱讀更多來自 科研圈 的精彩文章:

浙江大學李達三·葉耀珍幹細胞與再生醫學研究中心陳曉課題組博士後招聘
交談時很難保持眼神接觸?——你不是一個人
安全高效的無鉛太陽能電池

TAG:科研圈 |

您可能感興趣

自然語言處理論文10篇
自然語言處理論文筆記
自然語言處理領域論文筆記
ACL2017中國研究論文解讀:讀懂中國自然語言處理前沿進展
ACL 2017中國研究論文解讀:讀懂中國自然語言處理前沿進展
107篇論文被撤:有作者稱對論文撰寫投稿並不知情
自然語言處理領域歐洲頂級會議EACL 2017傑出論文出爐
107篇論文被撤:有通訊作者稱對論文撰寫投稿並不知情
推薦一組關於「非真」信息的論文及《現代傳播》2016年第7期
發表超過1450篇論文的怪才——「論文合作之王」
資源:自然語言處理數據集、語料庫和論文集合
計算語言頂會ACL 2017開幕在即:國內接收論文梳理(5篇傑出論文)
117篇撤稿論文,61份學術不端通報:「無賴性論文造假」太荒唐
自然語言處理領域的前沿技術:EMNLP 2017最佳論文公布
2016十大論文撤稿事件:學術界的醜聞與自凈
2016 十大論文撤稿事件:學術界的醜聞與自凈
五部門通報107篇論文被撤稿:涉521名作者,正甄別處理
論文快遞員——第32期:超材料論文摘要精選
英語論文格式