基于关系词的汉语多重复句层次结构的研究
发布时间:2017-08-07 16:04
本文关键词:基于关系词的汉语多重复句层次结构的研究
更多相关文章: 多重复句 关系词语 上下文无关文法 移进-归约 关系层次结构树
【摘要】:随着计算机技术的快速发展,中文信息处理作为计算语言学的一个重要的分支,在我国信息化建设过程中起到了举足轻重的作用。中文信息处理的现在的主要研究有字方面的处理、词方面的处理、句方面的处理和篇章方面的处理。目前,我国在字处理和词处理方面,已经有了大量研究成果,而且也有很不错的实际应用。但是对于句处理和段处理的研究还有待加强。多重复句通常由几个分句组成的,作为汉语语法当中重要的一部分,它在汉语语义方面的含义十分的丰富而且多样,因此多重复句的分析和处理在现在自然语言处理方面是最多见而且非常艰难的阶段,因此现在成为中文信息的研究重点。其中关系词是连接各个分句之间的一个重要的桥梁,现在对于关系词的研究正是一个方兴未艾的课题。本文的研究重点是对多重复句里面的层次结构,它是根据多种逻辑关系依据某种层次结构结合而成的复杂的关系层次结构分析和识别过程。基于关系词语在多重复句中的重要地位,本文首先利用规则对多重复句中的关系词语进行自动标识,在这一部分会介绍标识关系词语用到的各种规则表,以及如何把这些规则表形式化成机器可以识别的方法。根据多重复句中的关系词语,我们采用上下文无关文法对多重复句进行形式化的表述。由于知道关系词语的在复句中的前、后部位置所属是我们进行层次结构分析的必须的资源,所以我们将利用规则表和关系词语在各个分句中的具体位置来确定其的前、后部所属。最后我们可以利用改进的移进-归约分析算法借助已经处理好的关系词语对多重复句进行层次结构的分析。为了更好的显示出我们的研究分析结果,我们根据得到的层次结构可以将其形式化为关系层次树,以此来表示分句之间的连接关系和层次构成。
【关键词】:多重复句 关系词语 上下文无关文法 移进-归约 关系层次结构树
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:H08
【目录】:
- 摘要5-6
- Abstract6-10
- 第一章 绪论10-15
- 1.1 选题的背景及意义10
- 1.2 研究现状10-11
- 1.3 研究难点与创新11-13
- 1.4 论文目标与内容13
- 1.5 论文的组织结构13-15
- 第二章 利用规则对复句的关系词语的识别15-25
- 2.1 复句中关系词语的初探15-18
- 2.1.1 复句关系词语的分类15-16
- 2.1.2 复句关系词语的性质16-17
- 2.1.3 复句关系词语的范围17-18
- 2.2 复句中关系词语规则的表示及其形式化18-23
- 2.2.1 规则表18-20
- 2.2.2 规则表的表示20-21
- 2.2.3 复句规则的形式化21-23
- 2.3 利用规则对复句关系词语进行自动识别标注23
- 2.4 本章小结23-25
- 第三章 基于关系词语对多重复句关系层次结构的分析25-37
- 3.1 多重复句的形式化25-27
- 3.1.1 上下文无关文法25-26
- 3.1.2 多重复句的形式化表述26-27
- 3.2 层次结构分析中理论知识分析27-29
- 3.2.1 栈27-28
- 3.2.2 队列28-29
- 3.3 移进-归约分析方法29-31
- 3.3.1 移进-归约过程29-31
- 3.3.2 移进-归约过程中的冲突处理31
- 3.4 层次结构分析算法思路及其实现31-35
- 3.4.1 确定关系词语前后部所属32-33
- 3.4.2 归约操作33-35
- 3.4.3 多重复句层次结构分析过程35
- 3.5 本章小结35-37
- 第四章 实验结果及分析37-43
- 4.1 实验语料的准备37
- 4.2 实验工具介绍及应用37-38
- 4.3 基于规则的关系词语的识别提取38
- 4.4 关系词语前后部所属的确认38-39
- 4.5 利用移进-归约的层次结构分析39-41
- 4.6 实验结果和分析41-42
- 4.7 本章小结42-43
- 第五章 总结与展望43-45
- 5.1 全文总结43
- 5.2 进一步的研究工作43-45
- 参考文献45-48
- 校期间参加的科研项目和发表的论文48-49
- 致谢49
【引证文献】
中国重要会议论文全文数据库 前1条
1 张旭洁;夏幼明;刘冠晓;宋亚林;;基于规则方法的汉语到语义网络语言的转换研究[A];第三届学生计算语言学研讨会论文集[C];2006年
,本文编号:635484
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/635484.html