當前位置:
首頁 > 新聞 > ACL 2018 公布四篇最佳 demo 候選論文,三篇論文第一作者來自中國

ACL 2018 公布四篇最佳 demo 候選論文,三篇論文第一作者來自中國

雷鋒網 AI 科技評論按:7 月 9 日,自然語言處理頂會 ACL 公布了最佳 demo 論文的四篇候選論文,名單如下:

CRUISE: Cold-Start New Skill Development via Iterative Utterance Generation

Out-of-the-box Universal Romanization Tool

Platforms for Non-Speakers Annotating Names in Any Language

YEDDA: A lightweight Collaborative Text Span Annotation Tool

值得注意的是,四篇論文中有三篇論文的一作是中國研究者,他們分別是目前任職於三星美國研究中心的 Yilin Shen,倫斯勒理工學院博士生 Ying Lin,新加坡科技設計大學(SUTD)博士生 Jie Yang。最佳 demo 論文獎將在主會最佳論文 session 環節揭曉,屆時雷鋒網 AI 科技評論將會第一時間帶來現場報導。

本文將對這四篇論文進行簡單介紹。


最佳 demo 論文

CRUISE: Cold-Start New Skill Development via Iterative Utterance Generation

CRUISE:基於迭代語料生成的冷啟動新技能開發

論文摘要:我們提出了 CRUISE 系統,它可以指導普通軟體開發者從頭開始構建高質量的自然語言理解(NLU)引擎。構建該引擎是給個人助手(智能語音助手)添加新技能的基礎步驟。與開發者或眾包手動標註大量語料的現有解決方案不同,我們設計了一種基於規則和數據驅動的混合方法,該方法可以迭代生成越來越多的語料。我們的系統只需要少量人工在迭代中修改錯誤語料即可。CRUISE 系統會生成一個「訓練有素」的 NLU 引擎,同時還會生成一個大型已注釋語料庫,第三方可以基於此來開發自定義技能。通過使用基準數據集和自定義數據集,我們收集到了現實世界的設定,NLU 性能比賽和人類評價則證實了 CRUISE 生成語料的高質量。我們的工作大幅降低了人類認知負荷,同時縮短了人工剪枝時間。

論文作者:Yilin Shen, Avik Ray, Abhishek Patel,Hongxia Jin

論文地址:http://aclweb.org/anthology/P18-4018

Out-of-the-box Universal Romanization Tool

開箱即用的通用羅馬化工具

論文摘要:我們想介紹 uroman,這個工具可以把五花八門的語言和文字(如中文、阿拉伯語、西里爾文)轉換為普通拉丁文。該工具基於 Unicode 數據以及其他表,可以處理幾乎所有的字符集(包括一些晦澀難懂的語言比如藏文和提非納文)。uroman 還可以將不同文本中的數字轉換為阿拉伯數字。羅馬化讓比較不同文本的字元串相似性變得更加容易,因為不再需要將兩種文字翻譯成中間文字再比較。本工具作為一個 Perl 腳本,可以免費提供,可用於數據處理管道和互動式演示網頁。

論文作者:Ulf Hermjakob, Jonathan May,Kevin Knight

論文地址:http://aclweb.org/anthology/P18-4003

Platforms for Non-Speakers Annotating Names in Any Language

未知語言標註平台

論文摘要:我們將演示兩個標註平台,在該平台上,英語母語者即使不熟悉某種語言也可以用該語言進行標註。這些平台可以為低資源語言提供高質量的「銀標」注釋。平台目前在 LoreHLT20171 上的奧羅莫語和提格里尼亞語上取得了最佳成績,在 TAC-KBP EDL2017 的十項語言上取得了最佳成績。我們討論了平台的優點和局限性,並與其他的未知語言標註方法進行了比較。我們將向研究者們公開該工具。

論文作者:Ying Lin, Cash Costello, Boliang Zhang, Di Lu, Heng Ji, James Mayfield,Paul McNamee

論文地址:http://aclweb.org/anthology/P18-4001

YEDDA: a lightweight collaborative text span annotation tool

YEDDA:一種輕量型文本範圍注釋工具

論文摘要:在論文中,我們將介紹 YEDDA——一個輕量、高效且全面的開源文本範圍注釋工具。Yedda 為文本範圍注釋提供了系統化的解決方案,涵蓋了用戶協作標註到管理員評估與分析等需求。Yedda 可以用命令行和快捷鍵對文本進行標註,並以此克服傳統文本標註工具的低效率,用戶可以自定義命令行和快捷鍵。Yedda 還可以通過學習最新標註文本智能化為用戶提供標註意見。我們還開發了管理員客戶端用以評估多個注釋器的標註質量,並為每個注釋器生成詳細的比較報告。實驗表明,相較於現有標註工具,我們的系統可以節省一半的時間,使用智能推薦還能再節省 16.47% 的時間。

論文作者:Jie Yang, Yue Zhang, Linwei Li and Xingxuan Li

論文地址:https://arxiv.org/abs/1711.03759

雷鋒網 AI 科技評論將會第一時間為大家帶來 ACL 現場報道,敬請關注。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

谷歌之後,微軟也被指AI作惡
Magic Leap第一款AR內容教程,看起來跟ARKit沒什麼兩樣!

TAG:雷鋒網 |