当前位置:主页 > 文艺论文 > 语言艺术论文 >

基于深度学习的中文代词消解及其在问答系统中的应用

发布时间:2017-11-05 13:19

  本文关键词:基于深度学习的中文代词消解及其在问答系统中的应用


  更多相关文章: 代词消解 深度学习 词向量 神经网络 问答系统


【摘要】:自然语言中存在的指代和省略现象使得有一些话语独立来看存在语义缺失,这给机器理解带来了巨大的挑战。如何利用上下文信息对话语进行语义恢复是一项重要的研究任务。代词消解是语义恢复的重要方法,目前很多方法还停留在浅层的、显性的语义特征,并没有挖掘更深层次的语义关联。本文使用词向量作为输入,利用深度学习方法挖掘出较深层次的语义特征,实现中文代词消解算法,并应用到问答系统中。首先,研究中文显性代词消解表述对的深层语义特征表示方法。之前的代词消解算法抽取表述对的显性语义特征,如性别、数量,本文引入词向量,表示代词、候选先行语及上下文在语言学和隐含语义方面的特征,并与显性语义特征合并,共同作为表述对特征,训练神经网络分类器,相比于二者单独的使用,性能取得了显著的提升。接着,研究中文零代词消解算法,包括零代词识别和消解两个子任务。本文在零代词识别方面提出了基于循环神经网络、不依赖句法分析的算法;在消解方面沿用了显性代词消解的表述对模型,放弃其中的显性语义特征,增加更多有效的词向量特征,如相关动词和宾语,提出了基于神经网络的零代词消解算法;然后,通过引入长短期记忆网络,计算表述对的更深层语义特征表示,提出了基于长短期记忆网络的进阶消解算法。本文提出的零代词消解算法在识别和消解子任务上超越了基线方法。最后,设计实现了交互式问答系统。其中,提出了基于词语共现模型的省略恢复算法,与代词消解一同构成语义补全模块,应用到系统中,利用短期历史提问信息,从指代和省略两个方面,对待检索问题进行语义补全,使用补全语义的待检索问题进行检索,提高系统检索的准确性。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1;H146


本文编号:1144359

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanyishu/1144359.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户54cea***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com