蒙汉双语树库建设
本文选题:树库 切入点:蒙古语句子 出处:《内蒙古大学》2017年硕士论文 论文类型:学位论文
【摘要】:目前,树库建设已经成为自然语言处理不可缺少的组成部分。树库的发展趋势是作为重要的语言资源,为自然语言处理提供各种知识支持。现有的树库大多为单语树库。双语树库则以不同的应用目的而建设。本文选择内蒙古大学现代蒙古语短语结构树库词语标记集及句法标记集和东北大学自然语言处理实验室中文句法语义系统的词语标记集及句法标记集为标注体系,从汉蒙政府翻译文献中抽取蒙汉句对,进行词性标注和句法结构标注,并校对,对蒙汉双语树库建设方面进行探索研究。在此基础上,对蒙古语和汉语短语结构进行了对比研究。论文由导论、第一章、第二章、第三章、结论等五个部分组成。导论部分,阐述了选题意义,研究理论方法及步骤。论述语料库和树库建设与加工相关的研究概况。第一章,在蒙汉双语树库语料来源及所用标注集和语料加工步骤的前提下探讨了蒙汉双语树库研制中遇到的问题。第二章,介绍了蒙汉双语树库及其管理软件的主要功能和实现算法。第三章,利用研制的蒙汉双语树库,对蒙古语和汉语短语结构问题进行了对比研究。结论部分,总结了全文内容。
[Abstract]:At present, the construction of tree bank has become an indispensable part of natural language processing. The development trend of tree bank is as an important language resource. All kinds of knowledge support are provided for natural language processing. Most of the existing treebanks are monolingual. Bilingual treebanks are constructed for different purposes. This paper chooses the tagging of modern Mongolian phrase structure treebanks in Inner Mongolia University. The set of syntactic markers and the set of lexical markers and syntactic markers of the Chinese syntactic and semantic system in the Natural language processing Laboratory of Northeastern University are the tagging systems. This paper extracts Mongolian and Chinese sentence pairs from the translation documents of Han and Mongolian governments, carries out part of speech tagging and syntactic structure tagging, and proofreads them to explore the construction of Mongolian and Chinese bilingual tree banks. The thesis is composed of five parts: introduction, chapter one, chapter two, chapter three, conclusion. Research methods and steps. Review the research of corpus and treebank construction related to processing. Chapter 1, This paper discusses the problems encountered in the development of the Mongolian and Chinese bilingual tree bank on the premise of the source of the Mongolian and Chinese bilingual tree data, the tagging set used and the processing steps of the corpus. Chapter two, This paper introduces the main functions and implementation algorithms of Mongolian and Chinese bilingual tree base and its management software. Chapter three makes a comparative study of Mongolian and Chinese phrase structure using the developed Mongolian and Chinese bilingual tree library. The conclusion part summarizes the content of this paper.
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:H212
【参考文献】
相关期刊论文 前10条
1 吴玲;;句法学视角下汉语形容词词性问题研究[J];郑州大学学报(哲学社会科学版);2016年03期
2 李发杰;余正涛;郭剑毅;李英;周兰江;;借助汉-越双语词对齐语料构建越南语依存树库[J];中文信息学报;2015年06期
3 刘磊;;语言学研究中的树库建设及其应用[J];燕山大学学报(哲学社会科学版);2014年01期
4 曹井香;黄德根;王伟;王帅军;;中英平行短语依存树库构建[J];大连理工大学学报;2014年01期
5 施春宏;张瑞朋;;论中介语语料库的平衡性问题[J];语言文字应用;2013年02期
6 曹贤文;;留学生汉语中介语纵向语料库建设的若干问题[J];语言文字应用;2013年02期
7 黄立波;朱志瑜;;国内英汉双语平行语料库建构与研究现状及展望[J];当代外语研究;2013年01期
8 王克非;黄立波;;国外双语库研制与应用评析[J];外语电化教学;2012年06期
9 王慧兰;;汉语句类依存树库的构建研究[J];北京大学学报(自然科学版);2013年01期
10 陈爱兵;;双语语料库在翻译实践中的应用初探[J];南昌高专学报;2011年01期
相关会议论文 前1条
1 德·萨日娜;那顺乌日图;;《蒙古语语义信息词典》的初步构建[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
相关重要报纸文章 前1条
1 吴义诚;;从静到动:动态句法学的语言观[N];中国社会科学报;2012年
相关博士学位论文 前3条
1 曹井香;中英平行短语依存树库的构建与应用研究[D];大连理工大学;2013年
2 张建梅;基于语料库的现代蒙古语简单陈述句句型分析研究[D];内蒙古大学;2010年
3 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
相关硕士学位论文 前2条
1 李华栋;基于规则的汉语兼类词标注方法研究[D];西南交通大学;2014年
2 牟小峰;面向英汉机器翻译的树库建设[D];北京语言大学;2007年
,本文编号:1615830
本文链接:https://www.wllwen.com/shoufeilunwen/zaizhiboshi/1615830.html