Papers-details

来自SUDA-HLT
跳到导航 跳到搜索
  • Zhenghua Li, Xue Peng, Min Zhang, Rui Wang, Luo Si. 2019. Semi-supervised Domain Adaptation for Dependency Parsing. Proceedings of ACL-2019, pp. x-x. Florence, Italy, 28 Jul. - 2 Aug. 2019.
摘要:在过去的几十年,由于缺乏充足的标注数据,大多数关于跨领域分析的研究都假设没有目标领域训练数据,集中在无监督领域移植方法。然而,由于领域移植和分析的内在困难,截止到目前,无监督方法仅取得了有限的进展。本文基于两个新标注的大规模领域感知数据集,解决了中文依存句法分析的半监督领域移植问题。我们提出了一种简单的领域嵌入方法来合并源领域和目标领域训练集,这种方法比直接合并训练集和多任务学习更有效。 为了利用无标注目标域数据,我们采用了最近提出的上下文相关的词表示,并通过简单的微调进一步提高了跨领域解析的准确率。
  • Ying Li, Zhenghua Li, Min Zhang, Rui Wang, Sheng Li, Luo Si. 2019. Self-attentive Biaffine Dependency Parsing. Proceedings of IJCAI-2019, pp. x-x. Macao, China, 10-16 Aug. 2019.
摘要:目前最好的依存分析方法使用双向长短期记忆网络对输入句子进行编码。受到基于转换方法在机器翻译成功应用的启发,本文首次将双向长短期记忆网络替换为自注意力机制应用于依存句法分析,并在中英文数据集上取得了可比的实验结果。然后,我们利用模型集成将双向长短期记忆网络和自注意力机制结合起来,通过详细的错误分析证明它们在获取上下文信息方面具有互补性。最后,我们探索了最近提出来的上下文词表示作为额外的输入特征,进一步提高了分析性能。
  • Qingrong Xia, Zhenghua Li, Min Zhang, Meishan Zhang, Guohong Fu, Rui Wang, Luo Si. 2019. Syntax-aware Neural Semantic Role Labeling. Proceedings of AAAI-2019, pp. x-x. Honolulu, Hawaii, America, 27 Jan. - 1 Feb. 2019.
摘要:语义角色标注,也称作为浅层语义分析,是一个重要且有挑战性的自然语言处理任务。受句法和语义结构之间的紧密联系所启发,传统的基于离散特征的语义角色标注方法大量使用了句法特征。相反,基于深度神经网络的方法通常将一个输入的句子编码为一个词序列,并不考虑对应的句法结构。在本工作中,我们研究了几种编码句法树的方法,然后对额外的句法驱动的表示是否有益于神经语义角色标注做了透彻的分析。在CoNLL-2005数据集上的实验结果表明,句法驱动的语义角色标注方法可以有效的提高一个使用了ELMo表示的很强的基准模型的性能。通过使用额外的句法驱动的表示,我们的方法在测试集上获得了新最高性能,85.6 F1值(单个模型)和86.6 F1值(集成模型),比仅仅使用了ELMo表示的基本模型分别高了0.8和1.0。为了对所探究的方法获得更多深刻的见解,我们做了详细的分析。
  • Wei Jiang, Zhenghua Li, Yu Zhang, Min Zhang. 2019. HLT@SUDA at SemEval 2019 Task 1: UCCA Graph Parsing as Constituent Tree Parsing. Proceedings of the 13th International Workshop on Semantic Evaluation (SemEval-2019), pp. 11-15. Minneapolis, Minnesota, America, 6-7 Jun. 2019.
摘要:本文描述了一种简单的UCCA语义图分析方法。核心思想是把UCCA图转化为短语结构树,并且设计了额外的标签来标记远程边和不连续节点用于之后的恢复。以这种方式我们就能利用现有句法分析技术。基于训练数据,我们根据短语结构分析器的输出标签直接恢复不连续节点,同时使用一个双仿射分类模型来恢复更加复杂的远程连接。该分类模型和短语结构分析器置于多任务学习框架下同时学习。在开放通道中,我们使用多语言的BERT作为额外的输入特征。我们的系统在六个通道(英语/德语,封闭/开放)中排名第一。其中由于法语只有很少的训练数据,我们提出了一语言嵌入的方法来利用英语和德语的训练数据,并且最终结果排名第二。