计算机所师生参加EMNLP 2018

　　2018年10月31日至11月4日，自然语言处理会议(The 2018 Conference on Empirical Methods in Natural Language Processing, 简称EMNLP)在比利时布鲁塞尔召开，计算机所赵东岩老师、万小军老师、孙薇薇老师、严睿老师和4名同学参加了此次会议。

　　EMNLP会议是自然语言处理领域的重要国际会议，一直受到国际学术界与工业界的广泛关注。这次会议包括了3个受邀演讲，14个工作研讨，6个任务教程以及3天的论文报告及海报展示，内容涵盖了语义分析、句法分析、信息抽取、对话系统、机器翻译等自然语言处理主流任务。

　　本届会议共收到有效投稿2,231篇，录用文章549篇，其中长文351篇，短文211篇。计算机所师生在本次会议上共发表了4篇长文，分别针对语义角色标注、自然语言问答、文本摘要、诗歌生成进行了研究，并在会议上做了口头报告和海报展示。论文具体信息如下：

　　[1] Zi Lin, Yuguang Duan, Yuanyuan Zhao, Weiwei Sun and Xiaojun Wan. Semantic Role Labeling for Learner Chinese: the Importance of Syntactic Parsing and L2-L1 Parallel Data.

　　该论文主要研究中介语上的语义角色标注。首先验证了在中介语上复用Chinese PropBank语义角色标注（SRL）规则的可行性，又测试了在母语上训练的SRL模型在中介语上的鲁棒性，从而发现了句法分析的重要性。最后，本文利用中介语-母语平行语料重新训练模型，提高了在中介语上的语义角色标注效果。

　　图1 林子在进行论文口头报告

　　[2] Sen Hu, Lei Zou, Xinbo Zhang: “A State-transition Framework to Answer Complex Questions over Knowledge Base”

　　该论文主要研究如何解析回答复杂的自然语言问题。首先分析了复杂问题解析过程中的困难，然后提出了一个状态转移框架和四种转移操作将自然语言问题转化为语义查询图从而能够使用现有的查询算法找到答案。与现有工作相比，本文的方法不依赖于人工定义的模板，针对复杂问题能够灵活的生成查询图，结构上不存在限制，在DBpedia和Freebase知识库上多个QA数据集取得了较好的结果。

　　图2 胡森(左)和赵东岩老师(右)在会场留影

　　[3] Xiuying Chen, Shen Gao, Chongyang Tao, Yan Song, Dongyan Zhao and Rui Yan. Iterative Document Representation Learning Towards Summarization with Polishing .

　　摘要生成任务通常都是基于单轮抽取，该论文创新地提出了一种迭代式多轮摘要抽取模型，并且引入了一种选择性读取机制，可以更准确地决定哪些句子表示需要更新。实验表明，本文模型在CNN/DailyMail和DUC2002数据集上均取得了SOTA效果。

　　[4] Juntao Li, Yan Song, Haisong Zhang, Dongmin Chen, Shuming Shi, Dongyan Zhao and Rui Yan. Generating Classical Chinese Poems via Conditional Variational Autoencoder and Adversarial Training

　　计算机自动创作表达流畅、文字优美的诗歌是一个难题。虽然之前的相关研究已经取得了引人注目的成果，自动生成的诗歌依然和诗人创作的有很大差距，尤其是主旨一致性和用词的新颖性。在本文中，研究人员提出结合条件变分自编码器和对抗训练的策略来生成诗歌。实验结果表明，不管是自动指标还是人工测评，本文的模型都有显著的提高。

　　图3 李俊涛(左)和陈秀颖(右)进行论文海报展示