基于主题注意力机制的中文古典诗歌自动生成研究
发布时间:2020-06-12 18:53
【摘要】:中国古典诗歌是传统文化的瑰宝,但随着现代社会的发展,普通人想要学习和创作诗歌的有很大的难度。因此利用自然语言处理技术进行古典诗歌自动生成研究,在弘扬和继承中国的传统文化、探索机器艺术创作等方面都很有意义。本文采用深度学习和自然语言处理技术,研究中文古典诗歌的自动生成问题。我们的主要工作和创新点是:(1)为了解决诗歌生成训练语料的自动构建,以及当前很多成功的系统很难基于现代概念生成相应诗歌的问题。我们先是采用了诗歌数据集增强策略,借助现有的文言文机器翻译系统构建出现代文到古诗文的“平行语料”。同时,考虑到文本生成的输入一般是对输出内容的高度概括。我们提出了基于结构化语义匹配框架的关键词提取方法。首先我们将译文中的词和古诗句表示成分布式语义向量,再将译文中的词和对应诗句的看作语义向量匹配问题。这里,我们第一次将数据集增强策略迁移到了诗歌生成任务中来;其次,我们提出的结构化语义匹配模型为关键词提取提供了 一种新思路。(2)目前很多系统生成的诗歌通常没有统一的主题,诗句的语义连贯性也很差。在文本中,我们通常把能够概括思想意图的叫做主题,主题可以由若干关键词表示。基于这样的常识,我们提出了基于主题注意力机制的诗歌生成模型。我们改造了传统的编码器-解码器框架,使其可以同时编码关键词序列和历史生成内容。我们首次提出在编码器端采用基于主题注意力机制的关键词加权平均方法,来保证生成诗歌与用户意图的主题一致性。并将主题注意力机制成功的运用于关键词的提取模块中。总的来说,我们很好的解决了模型训练语料的缺乏和诗歌生成系统很难基于现代概念生成相应诗歌的问题。并在一定程度上解决了生成诗歌的主题漂移和诗句的语义连贯问题。实验结果表明,我们的主题注意力机制对生成诗歌的质量有着显著的提升。同时,在与PPG模型的对比实验中,我们的模型也表现出了更好的性能。
【图文】:
基于主题注意力机制的中文古典诗歌自动生成研究逦逡逑基于序列生成对抗网络的方法逡逑寺11」提出的基于梯度g?略的序列生成对抗网络(Sequence邋Generative逡逑arial邋Nets)将序列生成过程当作一个序列决策的过程。将误差作为一种X楀义系慕崩砸恢智袄〉姆绞窖盗罚迷銮垦暗奶剿髂J饺ジ律赏纭e义希保八荆蛄猩啥钥雇绨礁瞿P停桓錾赡P停牵濉雠斜疱义稀e义
本文编号:2709955
【图文】:
基于主题注意力机制的中文古典诗歌自动生成研究逦逡逑基于序列生成对抗网络的方法逡逑寺11」提出的基于梯度g?略的序列生成对抗网络(Sequence邋Generative逡逑arial邋Nets)将序列生成过程当作一个序列决策的过程。将误差作为一种X楀义系慕崩砸恢智袄〉姆绞窖盗罚迷銮垦暗奶剿髂J饺ジ律赏纭e义希保八荆蛄猩啥钥雇绨礁瞿P停桓錾赡P停牵濉雠斜疱义稀e义
本文编号:2709955
本文链接:https://www.wllwen.com/gudaiwenxuelunwen/2709955.html