ACL 2019 最佳论文重磅出炉!华人团队包揽最佳长、短论文

100 阅读13分钟

【新智元导读】 ACL 最佳论文公布啦!本次共颁发 8 个奖项,华人团队包揽最佳长论文、最佳短论文以及两篇杰出论文大奖,再次印证中国的学术影响力。来看看这些论文都出自谁之手吧。

国际计算语言学协会 (ACL,The Association for Computational Linguistics),是世界上影响力最大、最具活力的国际学术组织之一,其会员遍布世界各地。ACL 会议是计算语言学领域的首要会议,广泛涉及自然语言的计算方法及其各类研究领域。计算语言学协会第 57 届年会,即 ACL 2019,于 7 月 28 日至 8 月 2 日在意大利佛罗伦萨举行。

友情提示,其他几个重要会议的举办地也公布啦:

EMNLP 2019 在香港举办,LREC 2020 在马赛举办,EMNLP 2020 在 Punta Cana 举办,COLING 2020 在巴塞罗那举办,AACL (ACL 亚太分会) 2020 在苏州举办,ACL 2020 在西雅图举办。

言归正传,ACL 2019 共设有 8 个奖项:

  • 最佳长论文
  • 最佳短论文
  • 最佳 demo 论文
  • 5 篇杰出论文

值得一提的是,华人团队包揽了最佳长论文、最佳短论文以及两篇杰出论文大奖!

在提名的 32 篇论文中,一作为华人的有 13 篇(按照名字是否是汉语拼音来统计)。

今天,ACL 颁发了这 8 项大奖,来看看究竟花落谁家。

最佳论文 —— 长论文

获得最佳长论文的是 “Bridging the Gap between Training and Inference for Neural Machine Translation”,作者包括华为诺亚方舟实验室语音语义首席科学家刘群,以及来自中科院计算所、微信 AI、伍斯特理工学院的研究人员.

论文链接:

www.aclweb.org/anthology/P…

神经机器翻译 (NMT) 是根据上下文单词来预测下一个词的一种方式,并按顺序生成目标词。在训练时,NMT 以 ground truth 的单词作为上下文进行预测,但在推理时,它必须从头开始生成整个序列。

模型架构

这种差异导致了误差积累。此外,单词级训练要求生成的序列与 ground truth 序列严格匹配,这导致会对虽然不同但合理的翻译过度校正。

在这项研究中,我们通过不仅从 ground truth 序列中采样上下文单词,而且在训练期间从模型预测的序列中采样上下文单词,并选择句子级最优的预测序列来解决这些问题。

在中文 -> 英文和 WMT’14 英语 -> 德语翻译任务的实验结果表明,我们的方法可以在多个数据集上实现显著的改进。

Zh→En 翻译任务中不区分大小写的 BLEU 得分 (%)

最佳论文 —— 短论文

获得最佳短论文的是 “Do you know that Florence is packed with visitors? Evaluating state-of-the-art models of speaker commitment”,作者为 Nanjiang Jiang 和 Marie-Catherine de Marneffe,来自美国俄亥俄州立大学。

论文链接:

www.aclweb.org/anthology/P…

当一位名叫玛丽的说话人问:Do you know that Florence is packed with visitors?(你知道佛罗伦萨挤满了游客吗?)我们让她相信佛罗伦萨挤满了游客,但如果她问:Do you think that Florence is packed with visitors?(你认为佛罗伦萨挤满了游客吗?)推断说话人 commitment(又称事件事实)对于信息提取和问答是至关重要的。

在这里,我们通过分析一个具有挑战性的自然数据集上模型错误的语言相关性,探讨语言缺陷驱动说话人 commitment 模型的 error patterns 的假设。我们在 CommitmentBank 上评估了两个最先进的说话人 commitment 模型,这是一个自然发生话语的英语数据集。CommitmentBank 注释了说话人对补充内容的 commitment(在我们的例子中是 “Florence is packed with visitors”)嵌入动词(know, think)的四个 entailment-canceling 环境。

我们发现语言信息模型优于基于 LSTM 的模型,表明需要语言知识来获取这些具有挑战性的自然数据。按语言特征进行的项目分解显示出不对称的 error patterns:虽然模型在某些类别上取得了良好的表现(如否定类),但它们无法推广到自然语言中的各种语言结构(如条件类),指出了改进的方向。

最佳 demo 论文

ACL 2019 最佳 demo 论文由 Unbabel 的 OpenKiwi 摘得!

论文链接:

www.aclweb.org/anthology/P…

OpenKiwi 是一个基于 PyTorch 的开源机器翻译质量评估框架。

质量评估 (Quality estimation, QE) 是机器翻译中缺失的一个部分:它的目标是在不访问参考译文的情况下评估翻译系统的质量。

Unbabel 团队提出了 OpenKiwi,这是一个基于 PyTorch 的开源框架,它实现了 WMT 2015-18 共享任务中最好的 QE 系统,使得在相同的框架下对这些模型进行实验变得很容易。

使用 OpenKiwi 和这些模型的堆叠组合,该框架在 WMT 2018 英语 - 德语数据集上实现了最先进的单词级 QE 结果。

WMT 2018 单词级 QE 训练集的例子

该框架的特征包括:

  • 训练 QE 模型的框架,并使用预训练的模型来评估 MT。
  • 支持单词级和句子级的质量评估。
  • 在 PyTorch 中实现五个 QE 系统:QUETCH、NuQE、predictor-estimator、APE-QE,以及一个线性系统的堆叠集成。
  • 易于使用的 API。可以将其作为包导入其他项目或从命令行运行。
  • 提供脚本,在 WMT 2018 数据上运行预训练的 QE 模型。
  • 通过 yaml 配置文件轻松跟踪和复制实验。

结果

以下的结果来自 WMT18 质量评估共享任务,分别为单词级和句子级的测试集。

GitHub:github.com/Unbabel/Ope…

5篇杰出论文

今年 ACL 共评选出 5 篇杰出论文 (Outstanding Paper)。

论文链接:

www.aclweb.org/anthology/P…

第一篇杰出论文来自南京理工大学的夏睿 (Rui Xia) 和 Zixiang Ding,论文题为 “Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts”(情感 - 原因对提取:文本情感分析的一个新课题)。

它的创新之处包括:

  • 提出一项有趣的新任务:联合学习识别文本中的情绪及其原因。
  • 提出一个新的有趣的模型:两种不同类型的多任务体系结构,一种任务是独立的,另一种是交互的。
  • 根据互动的方向,可以提高情绪 (精确度) 或原因 (recall)。

论文链接:www.aclweb.org/anthology/P…

第二篇杰出论文来自洛桑联邦理工学院 (EPFL) 的 Maxime Peyrard,论文题为 “A Simple Theoretical Model of Importance for Summarization”。

本文的创新之处在于:

  • 讨论了自动文本摘要任务中一个长期存在的问题:如何衡量摘要内容的合适性?
  • 提出 “内容重要性” 的一个理论模型,包含 3 个 part
  • 提出了评价指标
  • 与标准指标和人类判断进行了比较

论文链接:www.aclweb.org/anthology/P…

第三篇杰出论文来自香港科技大学和 Salesforce 研究院,论文题为 “Transferable Multi-Domain State Generator for Task-Oriented”(面向任务的可迁移多域状态生成器)。

它的创新之处在于:

  • 解决了一个传统但尚未解决的问题:对话状态跟踪中的不可见状态,证明了从用户话语生成对话状态是可能的
  • 新方法可扩展到大型值的集合,并处理以前不可见的值。
  • 除了展示最新的研究成果外,本文还研究了新领域的 few-shot 学习。

第四篇杰出论文来自纽约城市大学和俄勒冈健康与科学大学,论文题为:We need to talk about standard splits

论文地址:www.aclweb.org/anthology/P…

这篇论文的创新之处在于:

  • 对在数据集的标准分割上评估NLP方法的公认实践提出了质疑。
  • 使用POS标签来说明问题
  • 建议系统的排名使用随机分割,基于重复评估

论文链接:www.aclweb.org/anthology/P…

第五篇杰出论文来自印度科学理工学院和卡内基梅隆大学,题目是“Zero-shot Word Sense Disambiguation using Sense Definition Embeddings”(使用感知定义嵌入的 zero-shot 词意义消歧)。

本文的创新之处在于:

  • 一种新的词义消歧系统,聚焦提高罕见单词和未见过的单词的表现

  • sense selection 任务作为一项持续任务对待,用到了资源组合

  • 结果富有洞察力,提高了最好水平

2905 份提交论文,中美投稿最多

今年的 ACL 异常火爆,投稿人数众多。截止到提交截止日期,ACL 2019 收到了多达 2905 份提交论文。这比 ACL 2018 增加了 75% 以上,是 ACL 相关会议的历史记录!

ACL 2019 最终接收了 660 篇论文,总体接收率为 22.7%,略低于 ACL 2018(24.9%)或 2017 年 ACL(23.3%)的接收率。

接收的论文中,包含 447 份长论文和 213 份短论文,可见,短论文比长论文更难被接收。

接收方面最具挑战性的领域是文档分析(18.5%)和句子级语义(19.8%),以及信息提取和文本挖掘(20.6%)、词级语义(20.7%) 和音韵学、形态学和分词(20.9%)。

相比之下,接收率最高的领域是 Multidisciplinary 和 Area Chair COI(31.5%)。其他相对较高的接收领域包括视觉、机器人、多模式接地和语音(30.0%)、对话和交互系统(28.4%)以及资源和评估(28.1%)。

所有论文接收情况

长论文接收情况

短论文接收情况

ACL 2019 论文提交数量 Top 3 国家分别是美国(820 篇)、中国(817 篇)、英国(138 篇),美国、中国领跑,大幅领先其他国家。但在接收率方面,美国 28.8%、中国 19%。

国家 / 地区提交数量、接收数量和接收率统计入围最佳论文提名名单& 下载链接

以下是入围最佳论文奖项的名单:

长论文名单

  • 标题:Detecting Concealed Information in Text and Speech

  • 作者:Shengli Hu(康奈尔大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:AMR Parsing as Sequence-to-Graph Transduction

  • 作者:Sheng Zhang, Xutai Ma, Kevin Duh and Benjamin Van Durme(约翰霍普金斯大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Transferable Multi-Domain State Generator for Task-Oriented

  • 作者:Chien-Sheng Wu, Andrea Madotto, Ehsan Hosseini-Asl, Caiming Xiong, Richard Socher and Pascale Fung(香港科技大学、Salesforce 研究院)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:A Simple Theoretical Model of Importance for Summarization

  • 作者:Maxime Peyrard(瑞士洛桑联邦理工学院)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts

  • 作者:Rui Xia and Zixiang Ding(南京理工大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:OpenDialKG: Explainable Conversational Reasoning with Attention-based Walks over Knowledge Graphs

  • 作者:Seungwhan Moon, Pararth Shah, Anuj Kumar and Rajen Subba(新加坡国立大学、eBay、中国科学技术大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Visually Grounded Neural Syntax Acquisition

  • 作者:Haoyue Shi, Jiayuan Mao, Kevin Gimpel and Karen Livescu(丰田工业大学芝加哥分校、清华大学交叉信息研究院)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Neural Fuzzy Repair: Integrating Fuzzy Matches into Neural Machine Translation

  • 作者:Bram Bulte and Arda Tezcan

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Boosting Entity Linking Performance by Leveraging Unlabeled Documents

  • 作者:Phong Le and Ivan Titov(爱丁堡大学、阿姆斯特丹大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Meaning to Form: Measuring Systematicity as Information.

  • 作者:Tiago Pimentel, Arya D. McCarthy, Damian Blasi, Brian Roark and Ryan Cotterell(Kunumi、约翰霍普金斯大学、苏黎世大学 & 德国马普人类历史科学研究所 (MPI SHH)、谷歌、剑桥大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Scalable Syntax-Aware Language Models Using Knowledge Distillation.

  • 作者:Adhiguna Kuncoro, Chris Dyer, Laura Rimell, Stephen Clark and Phil Blunsom(DeepMind、牛津大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Zero-Shot Entity Linking by Reading Entity Descriptions

  • 作者:Lajanugen Logeswaran, Ming-Wei Chang, Kenton Lee, Kristina Toutanova, Jacob Devlin and Honglak Lee(密歇根大学、谷歌研究院)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Decomposable Neural Paraphrase Generation

  • 作者:Zichao Li, Xin Jiang, Lifeng Shang and Qun Liu(华为诺亚方舟实验室)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Robust Neural Machine Translation with Doubly Adversarial Inputs.

  • 作者:Yong Cheng, Lu Jiang and Wolfgang Macherey(谷歌 AI)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Bridging the Gap between Training and Inference for Neural Machine Translation.

  • 作者:Wen Zhang, Yang Feng, Fandong Meng, Di You and Qun Liu(中国科学院计算技术研究所、中国科学院大学、腾讯 WeChat AI、伍斯特理工学院、华为诺亚方舟实验室)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Zero-shot Word Sense Disambiguation using Sense Definition Embeddings

  • 作者:Sawan Kumar, Sharmistha Jat, Karan Saxena and Partha Talukdar(印度科学理工学院、卡内基梅隆大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Persuasion for Good: Towards a Personalized Persuasive Dialogue System for Social Good.

  • 作者:Xuewei Wang, Weiyan Shi, Richard Kim, Yoojung Oh, Sijia Yang, Jingwen Zhang and Zhou Yu(浙江大学、加利福尼亚大学戴维斯分校、宾夕法尼亚大学)

  • 链接:www.aclweb.org/anthology/P…

短论文名单

  • 标题:Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study.

  • 作者:Chinnadhurai Sankar, Sandeep Subramanian, Chris Pal, Sarath Chandar and Yoshua Bengio(MILA、蒙特利尔大学、蒙特利尔工程学院、谷歌大脑)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:The Risk of Racial Bias in Hate Speech Detection

  • 作者:Maarten Sap, Dallas Card, Saadia Gabriel, Yejin Choi and Noah A. Smith(华盛顿大学、CMU、艾伦人工智能研究所)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Evaluating Gender Bias in Machine Translation.

  • 作者:Gabriel Stanovsky, Noah A. Smith and Luke Zettlemoyer(华盛顿大学、艾伦人工智能研究所)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:We need to talk about standard splits

  • 作者:Kyle Gorman and Steven Bedrick(纽约市立大学、俄勒冈健康与科学大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:An Imitation Learning Approach to Unsupervised Parsing.

  • 作者:Bowen Li, Lili Mou, Frank Keller(爱丁堡大学、滑铁卢大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Improving Visual Question Answering by Referring to Generated Paragraph Captions.

  • 作者:Hyounghun Kim and Mohit Bansal(北卡罗来纳大学教堂山分校)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Towards Near-imperceptible Steganographic Text

  • 作者:Falcon Dai and Zheng Cai(丰田工业大学芝加哥分校、美国科罗拉多大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Do you know that Florence is packed with visitors? Evaluating state-of-the-art models of speaker commitment.

  • 作者:Nanjiang Jiang and Marie-Catherine de Marneffe(美国俄亥俄州立大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Studying Summarization Evaluation Metrics in the Appropriate Scoring Range

  • 作者:Maxime Peyrard

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Bilingual Lexicon Induction through Unsupervised Machine Translation.

  • 作者:Mikel Artetxe, Gorka Labaka and Eneko Agirre(西班牙巴斯克大学)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Corpus-based Check-up for Thesaurus

  • 作者:Natalia Loukachevitch(莫斯科国立罗蒙诺索夫大学)

  • 链接:www.aclweb.org/anthology/P…

demo 论文名单

  • 标题:GLTR: Statistical Detection and Visualization of Generated Text

  • 作者:Sebastian Gehrmann, Hendrik Strobelt and Alexander Rush(哈佛工学院、IBM 研究院)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:Texar: A Modularized, Versatile, and Extensible Toolkit for Text Generation

  • 作者:Zhiting Hu, Haoran Shi, Bowen Tan, Wentao Wang, Zichao Yang, Tiancheng Zhao, Junxian He, Lianhui Qin, Di Wang, Xuezhe Ma, Zhengzhong Liu, Xiaodan Liang, Wanrong Zhu, Devendra Sachan and Eric Xing(CMU、Petuum)

  • 链接:www.aclweb.org/anthology/W…

  • 标题:OpenKiwi: An Open Source Framework for Quality Estimation

  • 作者:Fabio Kepler, Jonay Trenous, Marcos Treviso, Miguel Vera and André F. T. Martins(Unbabel、Instituto de Telecomunicac¸oes)

  • 链接:www.aclweb.org/anthology/P…

  • 标题:ConvLab: Multi-Domain End-to-End Dialog System Platform

  • 作者:Sungjin Lee, Qi Zhu, Ryuichi Takanobu, Zheng Zhang, Yaoqin Zhang, Xiang Li, Jinchao Li, Baolin Peng, Xiujun Li, Minlie Huang and Jianfeng Gao(微软研究院、清华大学)

  • 链接:www.aclweb.org/anthology/P…


欢迎关注公众号【新智元】(公众号:AI_era),随时掌握人工智能领域第一手行业资讯。

初次见面,我们为您准备了惊喜福利,后台回复关键词即可领取!

回复【人工智能1】,领取英特尔人工智能学院免费公开课《机器学习》

回复【人工智能2】,领取英特尔人工智能学院免费公开课《机器学习》

回复【AI实践者】免费加入汇集顶尖行业专家和技术开发者社群!