當前位置:
首頁 > 新聞 > ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

【新智元導讀】ACL最佳論文公布啦!本次共頒發8個獎項,華人團隊包攬最佳長論文、最佳短論文以及兩篇傑出論文大獎,再次印證中國的學術影響力。來看看這些論文都出自誰之手吧。

國際計算語言學協會 (ACL,The Association for Computational Linguistics),是世界上影響力最大、最具活力的國際學術組織之一,其會員遍布世界各地。ACL 會議是計算語言學領域的首要會議,廣泛涉及自然語言的計算方法及其各類研究領域。計算語言學協會第57屆年會,即ACL 2019,於7月28日至8月2日在義大利佛羅倫薩舉行。

友情提示,其他幾個重要會議的舉辦地也公布啦:

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

EMNLP 2019在香港舉辦,LREC 2020在馬賽舉辦,EMNLP 2020在Punta Cana舉辦,COLING 2020在巴塞羅那舉辦,AACL(ACL亞太分會) 2020在蘇州舉辦,ACL 2020在西雅圖舉辦。

言歸正傳,ACL 2019共設有8個獎項:

  • 最佳長論文
  • 最佳短論文
  • 最佳demo論文
  • 5篇傑出論文

值得一提的是,華人團隊包攬了最佳長論文、最佳短論文以及兩篇傑出論文大獎!

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

在提名的32篇論文中,一作為華人的有13篇(按照名字是否是漢語拼音來統計)。

今天,ACL頒發了這8項大獎,來看看究竟花落誰家。


最佳論文——長論文

獲得最佳長論文的是「Bridging the Gap between Training and Inference for Neural Machine Translation」,作者包括華為諾亞方舟實驗室語音語義首席科學家劉群,以及來自中科院計算所、微信 AI、伍斯特理工學院的研究人員

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

論文鏈接:https://www.aclweb.org/anthology/P19-1426

神經機器翻譯(NMT)是根據上下文單詞來預測下一個詞的一種方式,並按順序生成目標詞。在訓練時,NMT以ground truth的單詞作為上下文進行預測,但在推理時,它必須從頭開始生成整個序列。

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

模型架構

這種差異導致了誤差積累。此外,單詞級訓練要求生成的序列與ground truth序列嚴格匹配,這導致會對雖然不同但合理的翻譯過度校正。

在這項研究中,我們通過不僅從ground truth序列中採樣上下文單詞,而且在訓練期間從模型預測的序列中採樣上下文單詞,並選擇句子級最優的預測序列來解決這些問題。

在中文->英文和WMT』14英語->德語翻譯任務的實驗結果表明,我們的方法可以在多個數據集上實現顯著的改進。

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

Zh→En翻譯任務中不區分大小寫的BLEU得分(%)


最佳論文——短論文

獲得最佳短論文的是「Do you know that Florence is packed with visitors? Evaluating state-of-the-art models of speaker commitment」,作者為Nanjiang Jiang和Marie-Catherine de Marneffe,來自美國俄亥俄州立大學。

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

論文鏈接:https://www.aclweb.org/anthology/P19-1412

當一位名叫瑪麗的說話人問:Do you know that Florence is packed with visitors?(你知道佛羅倫薩擠滿了遊客嗎?)我們讓她相信佛羅倫薩擠滿了遊客,但如果她問:Do you think that Florence is packed with visitors?(你認為佛羅倫薩擠滿了遊客嗎?)推斷說話人commitment(又稱事件事實)對於信息提取和問答是至關重要的。

在這裡,我們通過分析一個具有挑戰性的自然數據集上模型錯誤的語言相關性,探討語言缺陷驅動說話人commitment模型的error patterns的假設。我們在CommitmentBank上評估了兩個最先進的說話人commitment模型,這是一個自然發生話語的英語數據集。CommitmentBank注釋了說話人對補充內容的commitment(在我們的例子中是「Florence is packed with visitors」)嵌入動詞(know, think)的四個entailment-canceling環境。

我們發現語言信息模型優於基於LSTM的模型,表明需要語言知識來獲取這些具有挑戰性的自然數據。按語言特徵進行的項目分解顯示出不對稱的error patterns:雖然模型在某些類別上取得了良好的表現(如否定類),但它們無法推廣到自然語言中的各種語言結構(如條件類),指出了改進的方向。

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文


最佳demo論文

ACL 2019最佳demo論文由Unbabel的OpenKiwi摘得!

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

論文鏈接:https://www.aclweb.org/anthology/P19-3020

OpenKiwi是一個基於PyTorch的開源機器翻譯質量評估框架。

質量評估(Quality estimation, QE)是機器翻譯中缺失的一個部分:它的目標是在不訪問參考譯文的情況下評估翻譯系統的質量。

Unbabel團隊提出了OpenKiwi,這是一個基於PyTorch的開源框架,它實現了WMT 2015-18共享任務中最好的QE系統,使得在相同的框架下對這些模型進行實驗變得很容易。

使用OpenKiwi和這些模型的堆疊組合,該框架在WMT 2018英語-德語數據集上實現了最先進的單詞級QE結果。

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

WMT 2018 單詞級 QE 訓練集的例子

該框架的特徵包括:

  • 訓練QE模型的框架,並使用預訓練的模型來評估MT。
  • 支持單詞級和句子級的質量評估。
  • 在PyTorch中實現五個QE系統:QUETCH、NuQE、predictor-estimator、APE-QE,以及一個線性系統的堆疊集成。
  • 易於使用的API。可以將其作為包導入其他項目或從命令行運行。
  • 提供腳本,在WMT 2018數據上運行預訓練的QE模型。
  • 通過yaml配置文件輕鬆跟蹤和複製實驗。

結果

以下的結果來自WMT18質量評估共享任務,分別為單詞級和句子級的測試集。

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

GitHub:https://github.com/Unbabel/OpenKiwi

論文鏈接:https://www.aclweb.org/anthology/P19-3020


傑出論文

今年ACL共評選出5篇傑出論文(Outstanding Paper)。

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

論文鏈接:https://www.aclweb.org/anthology/P19-1096

第一篇傑出論文來自南京理工大學的夏睿(Rui Xia)和Zixiang Ding,論文題為「Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts」(情感-原因對提取:文本情感分析的一個新課題)。

它的創新之處包括:

  • 提出一項有趣的新任務:聯合學習識別文本中的情緒及其原因。
  • 提出一個新的有趣的模型:兩種不同類型的多任務體系結構,一種任務是獨立的,另一種是交互的。
  • 根據互動的方向,可以提高情緒(精確度)或原因(recall)。

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

論文鏈接:https://www.aclweb.org/anthology/P19-1502

第二篇傑出論文來自洛桑聯邦理工學院(EPFL)的Maxime Peyrard,論文題為「Studying Summarization Evaluation Metrics in the Appropriate Scoring Range」(在適當的評分範圍內研究摘要的評價指標)。

本文的創新之處在於:

  • 討論了自動文本摘要任務中一個長期存在的問題:如何衡量摘要內容的合適性?
  • 提出「內容重要性」的一個理論模型,包含3個part
  • 提出了評價指標
  • 與標準指標和人類判斷進行了比較

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

論文鏈接:https://www.aclweb.org/anthology/P19-1078

第三篇傑出論文來自香港科技大學和Salesforce研究院,論文題為「Transferable Multi-Domain State Generator for Task-Oriented」(面向任務的可遷移多域狀態生成器)。

它的創新之處在於:

  • 解決了一個傳統但尚未解決的問題:對話狀態跟蹤中的不可見狀態,證明了從用戶話語生成對話狀態是可能的
  • 新方法可擴展到大型值的集合,並處理以前不可見的值。
  • 除了展示最新的研究成果外,本文還研究了新領域的few-shot 學習。

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

論文鏈接:https://www.aclweb.org/anthology/P19-1568

第四篇傑出論文來自印度科學理工學院和卡內基梅隆大學,題目是「Zero-shot Word Sense Disambiguation using Sense Definition Embeddings」(使用感知定義嵌入的zero-shot詞意義消歧)。

本文的創新之處在於:

  • 一種新的詞義消歧系統,聚焦提高罕見單詞和未見過的單詞的表現
  • sense selection任務作為一項持續任務對待,用到了資源組合
  • 結果富有洞察力,提高了最好水平

2905份提交論文,中美投稿最多

今年的ACL異常火爆,投稿人數眾多。截止到提交截止日期,ACL 2019收到了多達2905份提交論文。這比 ACL 2018增加了 75% 以上,是ACL相關會議的歷史記錄!

ACL 2019最終接收了660篇論文,總體接收率為22.7%,略低於ACL 2018(24.9%)或2017年ACL(23.3%)的接收率。

接收的論文中,包含447份長論文和213份短論文,可見,短論文比長論文更難被接收。

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

接收方面最具挑戰性的領域是文檔分析(18.5%)和句子級語義(19.8%),以及信息提取和文本挖掘(20.6%)、詞級語義(20.7%) 和音韻學、形態學和分詞(20.9%)。

相比之下,接收率最高的領域是Multidisciplinary和Area Chair COI(31.5%)。其他相對較高的接收領域包括視覺、機器人、多模式接地和語音(30.0%)、對話和交互系統(28.4%)以及資源和評估(28.1%)。

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

所有論文接收情況

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

長論文接收情況

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

短論文接收情況

ACL 2019論文提交數量Top 3國家分別是美國(820篇)、中國(817篇)、英國(138篇),美國、中國領跑,大幅領先其他國家。但在接收率方面,美國28.8%、中國19%。

ACL 2019 最佳論文重磅出爐!華人團隊包攬最佳長、短論文

國家/地區提交數量、接收數量和接收率統計

入圍最佳論文提名名單&下載鏈接

長論文名單

  • 標題:Detecting Concealed Information in Text and Speech
  • 作者:Shengli Hu(康奈爾大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1039
  • 標題:AMR Parsing as Sequence-to-Graph Transduction
  • 作者:Sheng Zhang, Xutai Ma, Kevin Duh and Benjamin Van Durme(約翰霍普金斯大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1009
  • 標題:Transferable Multi-Domain State Generator for Task-Oriented
  • 作者:Chien-Sheng Wu, Andrea Madotto, Ehsan Hosseini-Asl, Caiming Xiong, Richard Socher and Pascale Fung(香港科技大學、Salesforce 研究院)
  • 鏈接:https://www.aclweb.org/anthology/P19-1078
  • 標題:A Simple Theoretical Model of Importance for Summarization
  • 作者:Maxime Peyrard(瑞士洛桑聯邦理工學院)
  • 鏈接:https://www.aclweb.org/anthology/P19-1101
  • 標題:Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts
  • 作者:Rui Xia and Zixiang Ding(南京理工大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1096
  • 標題:OpenDialKG: Explainable Conversational Reasoning with Attention-based Walks over Knowledge Graphs
  • 作者:Seungwhan Moon, Pararth Shah, Anuj Kumar and Rajen Subba(新加坡國立大學、eBay、中國科學技術大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1081
  • 標題:Visually Grounded Neural Syntax Acquisition
  • 作者:Haoyue Shi, Jiayuan Mao, Kevin Gimpel and Karen Livescu(豐田工業大學芝加哥分校、清華大學交叉信息研究院)
  • 鏈接:https://www.aclweb.org/anthology/P19-1180
  • 標題:Neural Fuzzy Repair: Integrating Fuzzy Matches into Neural Machine Translation
  • 作者:Bram Bulte and Arda Tezcan
  • 鏈接:https://www.aclweb.org/anthology/P19-1175
  • 標題:Boosting Entity Linking Performance by Leveraging Unlabeled Documents
  • 作者:Phong Le and Ivan Titov(愛丁堡大學、阿姆斯特丹大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1187
  • 標題:Meaning to Form: Measuring Systematicity as Information.
  • 作者:Tiago Pimentel, Arya D. McCarthy, Damian Blasi, Brian Roark and Ryan Cotterell(Kunumi、約翰霍普金斯大學、蘇黎世大學&德國馬普人類歷史科學研究所 (MPI SHH)、谷歌、劍橋大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1171
  • 標題:Scalable Syntax-Aware Language Models Using Knowledge Distillation.
  • 作者:Adhiguna Kuncoro, Chris Dyer, Laura Rimell, Stephen Clark and Phil Blunsom(DeepMind、牛津大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1337
  • 標題:Zero-Shot Entity Linking by Reading Entity Descriptions
  • 作者:Lajanugen Logeswaran, Ming-Wei Chang, Kenton Lee, Kristina Toutanova, Jacob Devlin and Honglak Lee(密歇根大學、谷歌研究院)
  • 鏈接:https://www.aclweb.org/anthology/P19-1335
  • 標題:Decomposable Neural Paraphrase Generation
  • 作者:Zichao Li, Xin Jiang, Lifeng Shang and Qun Liu(華為諾亞方舟實驗室)
  • 鏈接:https://www.aclweb.org/anthology/P19-1332
  • 標題:Robust Neural Machine Translation with Doubly Adversarial Inputs.
  • 作者:Yong Cheng, Lu Jiang and Wolfgang Macherey(谷歌 AI)
  • 鏈接:https://www.aclweb.org/anthology/P19-1425
  • 標題:Bridging the Gap between Training and Inference for Neural Machine Translation.
  • 作者:Wen Zhang, Yang Feng, Fandong Meng, Di You and Qun Liu(中國科學院計算技術研究所、中國科學院大學、騰訊 WeChat AI、伍斯特理工學院、華為諾亞方舟實驗室)
  • 鏈接:https://www.aclweb.org/anthology/P19-1426
  • 標題:Zero-shot Word Sense Disambiguation using Sense Definition Embeddings
  • 作者:Sawan Kumar, Sharmistha Jat, Karan Saxena and Partha Talukdar(印度科學理工學院、卡內基梅隆大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1568
  • 標題:Persuasion for Good: Towards a Personalized Persuasive Dialogue System for Social Good.
  • 作者:Xuewei Wang, Weiyan Shi, Richard Kim, Yoojung Oh, Sijia Yang, Jingwen Zhang and Zhou Yu(浙江大學、加利福尼亞大學戴維斯分校、賓夕法尼亞大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1566

短論文名單

  • 標題:Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study.
  • 作者:Chinnadhurai Sankar, Sandeep Subramanian, Chris Pal, Sarath Chandar and Yoshua Bengio(MILA、蒙特利爾大學、蒙特利爾工程學院、谷歌大腦)
  • 鏈接:https://www.aclweb.org/anthology/P19-1004
  • 標題:The Risk of Racial Bias in Hate Speech Detection
  • 作者:Maarten Sap, Dallas Card, Saadia Gabriel, Yejin Choi and Noah A. Smith(華盛頓大學、CMU、艾倫人工智慧研究所)
  • 鏈接:https://www.aclweb.org/anthology/P19-1163
  • 標題:Evaluating Gender Bias in Machine Translation.
  • 作者:Gabriel Stanovsky, Noah A. Smith and Luke Zettlemoyer(華盛頓大學、艾倫人工智慧研究所)
  • 鏈接:https://www.aclweb.org/anthology/P19-1164
  • 標題:We need to talk about standard splits
  • 作者:Kyle Gorman and Steven Bedrick(紐約市立大學、俄勒岡健康與科學大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1267
  • 標題:An Imitation Learning Approach to Unsupervised Parsing.
  • 作者:Bowen Li, Lili Mou, Frank Keller(愛丁堡大學、滑鐵盧大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1338
  • 標題:Improving Visual Question Answering by Referring to Generated Paragraph Captions.
  • 作者:Hyounghun Kim and Mohit Bansal(北卡羅來納大學教堂山分校)
  • 鏈接:https://www.aclweb.org/anthology/P19-1351
  • 標題:Towards Near-imperceptible Steganographic Text
  • 作者:Falcon Dai and Zheng Cai(豐田工業大學芝加哥分校、美國科羅拉多大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1422
  • 標題:Do you know that Florence is packed with visitors? Evaluating state-of-the-art models of speaker commitment.
  • 作者:Nanjiang Jiang and Marie-Catherine de Marneffe(美國俄亥俄州立大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1412
  • 標題:Studying Summarization Evaluation Metrics in the Appropriate Scoring Range
  • 作者:Maxime Peyrard
  • 鏈接:https://www.aclweb.org/anthology/P19-1502
  • 標題:Bilingual Lexicon Induction through Unsupervised Machine Translation.
  • 作者:Mikel Artetxe, Gorka Labaka and Eneko Agirre(西班牙巴斯克大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1494
  • 標題:Corpus-based Check-up for Thesaurus
  • 作者:Natalia Loukachevitch(莫斯科國立羅蒙諾索夫大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-1577

demo論文名單

  • 標題:GLTR: Statistical Detection and Visualization of Generated Text
  • 作者:Sebastian Gehrmann, Hendrik Strobelt and Alexander Rush(哈佛工學院、IBM 研究院)
  • 鏈接:https://www.aclweb.org/anthology/P19-3019
  • 標題:Texar: A Modularized, Versatile, and Extensible Toolkit for Text Generation
  • 作者:Zhiting Hu, Haoran Shi, Bowen Tan, Wentao Wang, Zichao Yang, Tiancheng Zhao, Junxian He, Lianhui Qin, Di Wang, Xuezhe Ma, Zhengzhong Liu, Xiaodan Liang, Wanrong Zhu, Devendra Sachan and Eric Xing(CMU、Petuum)
  • 鏈接:https://www.aclweb.org/anthology/W18-2503
  • 標題:OpenKiwi: An Open Source Framework for Quality Estimation
  • 作者:Fabio Kepler, Jonay Trenous, Marcos Treviso, Miguel Vera and André F. T. Martins(Unbabel、Instituto de Telecomunicac?oes)
  • 鏈接:https://www.aclweb.org/anthology/P19-3020
  • 標題:ConvLab: Multi-Domain End-to-End Dialog System Platform
  • 作者:Sungjin Lee, Qi Zhu, Ryuichi Takanobu, Zheng Zhang, Yaoqin Zhang, Xiang Li, Jinchao Li, Baolin Peng, Xiujun Li, Minlie Huang and Jianfeng Gao(微軟研究院、清華大學)
  • 鏈接:https://www.aclweb.org/anthology/P19-3011

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

Reddit熱議:Nature預測餘震論文被疑存重大缺陷,論文作者回懟
清華劉知遠:寫給想要填報CS/AI志願的考生們

TAG:新智元 |