論文推薦:2017頂會CVPR、EACL和ICLR的優秀論文
機器之心報道
EACL 2017傑出論文
論文一:循環神經網路語法能學到什麼句法?(What Do Recurrent Neural Network Grammars Learn About Syntax?)
鏈接:https://arxiv.org/abs/1611.05774
摘要:循環神經網路語法(RNNG)是近期提出的一個用於自然語言處理的概率生成模型家族。它們展示了最先進的語言建模以及解析效果。我們從語言學的角度,通過多種對模型和數據的磨蝕(ablation),用一個注意力機制(GA-RNNG)增強模型(以便近一步觀察),研究了它們學習的內容。我們發現,想要獲得最佳性能表現,關鍵就是詳細地為構成(composition)建模。通過注意力機制,我們發現中心語(headedness)在短語表徵中(帶有模型潛在注意力機制,該機制與人工中心語規則所做預測大部分一致,儘管也有些重要區別)起關鍵作用。通過在沒有非終結符標籤的情況下訓練語法,我們發現,短語表徵最低程度地取決於非終結符,這為向心性假設(endocentricity hypothesis)提供了支持。
圖 1:RNNG 的組成部分:一個堆棧、、生成辭彙的緩衝器和導致當前配置的過往動作的列表。每個部分都被嵌入了 LSTM,解析器狀態總結 ut(如圖)被視為頂層特徵,用於根據所有可行動作預測一個 softmax. 上圖源於 Dyer et al. (2016)。
圖 2:在每個 REDUCE 運行中,RNNG 的結構功能;右邊的網路是左邊結構的建模 (Dyer et al., 2016)。
論文二(短論文):用於實現主體構形範式的基於字元串的神經圖模型(Neural Graphical Models over Strings for Principal Parts Morphological Paradigm Completion)
鏈接:
https://ryancotterell.github.io/papers/cotterell+ala.eacl17.pdf
摘要:世界上很多語言都存在豐富的詞素(lexeme)相互影響的形式。處理這類語言的主要任務就是預測這些相互影響的形式。我們提出了一種新的統計模型,該模型利用了圖建模技術(graphical modeling techniques)以及深度學習近期取得的一些進展。我們求導了一個 Metropolis-Hastings 演算法來一起解碼該模型。我們這個貝葉斯網路的靈感來自主體構形分析(principal parts morphological analysis)。我們也證實了,在五種語言中,這一方法確實改善了預測效果。
圖 1:兩個潛在的圖模型,用於實現範式完成。(a)的拓撲結構編碼了網路,其中所有的形式都是依據詞素預測出來的。(b)是一個以主體構形為靈感的拓撲結構。
論文三:使用 GAP 過渡的增量不連續短語結構解析(Incremental Discontinuous Phrase Structure Parsing with the GAP Transition)
鏈接:http://www.llf.cnrs.fr/sites/llf.cnrs.fr/files/u485/eacl2017.pdf
摘要:本文介紹了一種用於不連續詞法化成分解析(discontinuous lexicalized constituent parsing)的全新的過渡系統(transition system),稱為 SR-GAP。這是帶有一個額外的 GAP 過渡的移位歸約演算法(shift-reduce algorithm)的一種擴展。在兩個德語樹庫上的評估表明 SR-GAP 的表現極大地優於之前最佳的基於過渡的不連續解析器(Maier, 2015)(在不連續成分的預測精度上達到了顯著的 2 倍),並且可媲美當前最佳(Daniel Fernández-González and André F. T. Martins, 2015)。我們還有一個附帶貢獻——將跨度特徵(span features,Hall et al., 2014)調整應用到了不連續解析上。
圖 1:從 Tiger 語料庫(移除了標點)中提取出的不連續樹
圖 2:詞法化的二值化樹。符號 * 編碼了頭信息。添加了後綴 : 的符號是由二值化所引入的臨時符號。
CVPR 2017最新論文:使用VTransE網路進行視覺關係檢測
摘要:「一個人騎自行車」和「在汽車旁邊騎自行車」這樣的視覺關係能為理解圖像提供綜合場景,也在計算機視覺和自然語言的連接上展現了其作用。然而,由於建模主謂賓關係三元組的組合複雜性(combinatorial complexity),很少有工作研究定位和預測視覺關係。基於最近知識庫的關係表徵學習和卷積網路檢測物體的發展,我們提出了一種用於視覺關係檢測的視覺轉化嵌入網路(VTransE,Visual Translation Embedding network)。VTransE 在低維關係空間確定物體關係,這種關係可被建模為簡單的向量轉換,即主語+謂語≈賓語。我們提出一種全新的特徵提取層,能夠以全卷積的方式完成物體關係知識(object-relation knowledge)的遷移,其支持在簡單的前向後向通路中訓練與推理。據我們所知,VTransE 是首個端到端的關係檢測網路。我們在兩個大型數據集(Visual Relationship 和 Visual Genome)上證明了 VTransE 相比其他頂級方法的有效性。要注意,雖然 VTransE 只是一個純視覺模型,它仍然可與 Lu 的帶有語言先驗知識的多模態模型媲美。
圖 1:在此論文中,我們的重點是檢測視覺關係(中間一層的虛線框)。不同於低層視覺和高層語言之間的直接關係,視覺關係提供物體交互間的直接理解。這能為圖像注釋、問答系統這樣的應用提供更深的語義信息。
圖 3:VTransE 網路概述。輸入圖像首先通過物體檢測模塊(也就是一個卷積定位網路),輸出一系列檢測到的物體。然後,檢測到的物體被輸入到關係預測模塊進行特徵提取和視覺轉換潛入。特別地,物體的視覺特徵使用 Bilinear Interpolation 從最後的卷積特徵映射提取出來。
劍橋與微軟提交ICLR 2017論文提出DeepCoder
摘要:我們開發了一種使用輸入-輸出樣本的深度學習來解決編程競賽風格(programming competition-style)問題。該方法通過訓練神經網路來預測由輸入到輸出生成的程序屬性。我們使用神經網路的預測來增強在編程中進行搜尋的技術,其包括了枚舉搜尋(enumerative search)和基於 SMT 的解算器(SMT-based solver)。實證表明,我們的方法可以在強非增強型基線(strong non-augmented baselines)和遞歸神經網路(Recurrent Neural Network)方法上產生一個數量級的加速,並且我們能夠解決和在編程競賽中比最簡單問題更複雜一些的問題。


※Hinton「神經網路與機器學習」課程經驗與簡評
※論文導讀:從強化學習到進化策略
※基於Sonnet,DeepMind開源可微神經計算機實現包
※腦波打字,皮膚聽覺:Facebook 展示全新人機交互技術
※商湯科技獲賽領資本6000萬美元投資,將加速商業化布局
TAG:機器之心 |
※下一代高性能資料庫標杆POLARDB 亮相頂會VLDB2017
※ICML2017:谷歌正在佔領這屆ML頂會,4大主旨演講曝光
※周少華Kevin:醫學影像分析頂會MICCAI 17有哪些驚喜?
※自然語言處理頂會EMNLP最佳論文3項出爐:Facebook智能體創造「語言」獲獎
※計算語言頂會ACL 2017開幕在即:國內接收論文梳理(5篇傑出論文)
※360入圍USENIX Security 國際信息安全頂會迎來中國安全公司
※IBM謝國彤:認知醫療四大焦點,醫藥信息學頂會MedInfo2017最佳論文解讀
※計算語言頂會ACL 2017開幕在即:國內接收論文梳理
※信息檢索頂會SIGIR獎項:微軟最佳論文、清華最佳學生論文
※「ICML2017」谷歌正在佔領這屆機器學習頂會,4大主旨演講曝光
※4位CVPR論文講者乾貨大爆料,想要在頂會發Paper 必看!
※第一個手機端分布式深度學習系統,設計自動化頂會 DATE 最佳論文
※在分析了AI頂會上的6163篇論文後,我們能發現怎樣的發展趨勢與變化?……
※為何中國古代和尚頭頂會燒戒疤?
※頂會審稿人領你打開深度學習的大門
※古人脫髮禿頂會怎麼辦
※父親禿頂會遺傳給子女嗎?揭開禿頂的遺傳學秘密
※腦洞大開!當集裝箱成為屋頂會發生什麼?