【摘要】:随着“互联网+”时代的到来,一些传统的学科受计算机技术的影响,产生了一些新的研究方向与研究方法。其中自然语言处理作为一门语言学与计算机科学相交叉的学科,逐渐成为人们关注的热点。自然语言处理的核心是对自然语言进行理解,而构建语义角色标注语料库可以有效地帮助计算机理解复杂的自然语言。本文的工作主要包括以下三个方面。第一,提出树结构的谓词论元结构标注框架并构建14463句规模的标注语料库。目前国内外基于语料库进行语义角色标注的研究很多,包括基于短语结构语法的语义角色标注和基于依存语法的语义角色标注。在利用依存语法理论构建语义角色标注语料库方面,目前大多数可用的语义资源标注后形成的是语义依存图的形式,其中包含多个父节点,并且允许依存弧相互交叉,这使得论元结构的自动标注在计算时更加费时费力。针对上述问题,本文提出一种新的标注框架,通过建立一种兼具谓词论元信息和句法依存关系的依存树,来确保句法和语义标签的兼容性,在该框架中句法标注和语义标注之间的依存弧相同,改变的只是依存关系标签,这样能保证标注语义信息后形成的依然是一棵依存树而非一幅依存图。第二,提出语义角色传递机制以描写包括主语在内的成分省略现象。据统计汉语中只有64%的句子有主语,这表明汉语中主语成分的空缺是一个非常值得研究的课题。比如句子“他应邀在北京举办了个人演唱会”,根据依存语法原则,“他”与“举办”之间有依存弧,在进行语义角色标注时我们可以将其标注为“主事”;但是“他”跟“应邀”之间没有依存关系,为了将这两者之间的语义关系构建出来,本文提出了语义角色传递机制,即主语“他”可以通过动词“举办”传给动词“应邀”,做“应邀”的主事。第三,基于标注语料库对语义角色传递现象进行系统分析。本文利用空语类理论对语料库中存在的语义角色传递现象进行了深入细致的描述,相较于传统的基于内省的汉语定性研究,本文的方法立足于真实语料,能够更加客观地对传递现象进行分析和总结。本文共分为以下四个部分:绪论,主要介绍本文的选题背景、相关理论、相关研究、研究方法以及研究意义。选题背景主要阐述本文选题缘由;理论背景主要包括依存语法理论、论元理论和空语类理论。相关研究主要阐述了语义角色划分、语义角色标注语料库构建、句法与语义角色对应关系以及现代汉语空语类现象研究这四个方面的内容;在研究方法上,本文主要采用人工构建语料库的方法、理论分析与定量分析相结合的方法。语义角色标注的意义在于对结构不同但具有相同语义关系的句子给出一致标注,并且为了保持句法与语义结构的兼容,提出语义角色传递机制。第一章,叙述语义依存树库的框架。所叙框架旨在对句法结构不同、基本逻辑语义相同的句子给出一致标注。本章主要介绍语义角色标注语料库的语料来源、语义角色类型、标注规则以及标注平台。第二章,语义角色传递机制。语义角色传递机制的提出是为了消解依存树库中句法结构信息和语义信息之间的不兼容性。本章主要介绍了语义角色传递机制的提出动机、具体内容和传递示例。第三章,语义角色标注语料库的研究分析。本章首先将宾州中文树库中对空语类现象的归类和本文作了对比;其次分别对主语、话题和宾语的传递做了统计分析;最后把句法和语义之间的关系进行了对应分析。结语,概括本文的主要研究内容、研究成果;总结本文对中文信息处理以及汉语语法、语义研究的意义;最后,分析本文研究的不足之处并对下一步工作进行规划。
【学位授予单位】:鲁东大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:H146
【参考文献】
相关期刊论文 前10条
1 刘涛;杨亦鸣;;基于事件相关电位的空语类分类的神经机制研究[J];外语研究;2016年05期
2 陈艳彬;邱小琦;杨绪明;;汉语空语类研究述评[J];广西师范学院学报(哲学社会科学版);2016年04期
3 孙道功;;基于大规模语义知识库的“词汇—句法语义”接口研究[J];语言文字应用;2016年02期
4 郑丽娟;邵艳秋;;基于语义依存图库的兼语句句模研究[J];中文信息学报;2015年06期
5 史林林;邱立坤;亢世勇;;基于规则的依存树库错误自动检测与分析[J];北京大学学报(自然科学版);2016年01期
6 邱立坤;史林林;王厚峰;;多领域中文依存树库构建与影响统计句法分析因素之分析[J];中文信息学报;2015年05期
7 邱立坤;金澎;王厚峰;;基于依存语法构建多视图汉语树库[J];中文信息学报;2015年03期
8 蒋晨_g;;空语类理论及汉语空语类研究发展史[J];赤峰学院学报(汉文哲学社会科学版);2014年08期
9 亢世勇;许小星;马永腾;;施事、受事句法实现的义类制约[J];语文研究;2011年04期
10 刘宇红;;生成语法中词汇语义与句法的界面研究[J];外语学刊;2011年05期
相关会议论文 前1条
1 邵艳秋;邱立坤;梁春霞;毛宁;;中文语义依存树库构建及自动分析技术[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
相关硕士学位论文 前7条
1 何保荣;中文语义角色标注语料库的构建及统计分析[D];鲁东大学;2017年
2 尚永璨;“句法—语义”接口中词汇与句法互动制约研究[D];南京师范大学;2017年
3 王婧仪;基于标注语料库的一价动词的“句法—语义”接口研究[D];南京师范大学;2017年
4 邢翠鹃;汉语依存图库的构建[D];南京师范大学;2015年
5 丁宇;基于依存图的中文语义分析[D];哈尔滨工业大学;2014年
6 李娜;基于标注语料库的手部动作义场的“词汇—句法语义”接口研究[D];南京师范大学;2014年
7 王丽杰;汉语语义依存分析研究[D];哈尔滨工业大学;2010年
本文编号:
2804151
本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/2804151.html