日蒙机器翻译及相关技术研究
本文关键词:日蒙机器翻译及相关技术研究
更多相关文章: 日蒙机器翻译 附加成分分析 日蒙调序规则 句法分析
【摘要】:本文在借鉴以往机器翻译研究的理论和方法的基础上,充分利用日语和蒙古语在语法结构上极为接近的特征,研究实现了一套日蒙机器翻译系统。在系统资源方面,我们利用日本每日报2002年版,随机选择了农、林、牧、水相关报道800多篇建立了语料库,在此基础上编写了日蒙词干词典。在本文研究中,引用日语新语法即派生文法,研发了基于派生文法的日语句法分析器。为了提高日蒙机器翻译的性能,本文从以下几个方面着重进行了研究: (1)为了充分利用派生文法与蒙古语语法的相似特征,有必要把基于传统语法的日语词法分析器分析出来的结果重新分析,使其成为具有派生文法中所定义的附加成分形式。为此,研发了基于派生文法的附加成分分析器,实现了从基于传统语法词法分析到基于派生文法词法分析的转换。 (2)提出了基于蒙古语语序的日语句节调序方法,解决了动词句节翻译中出现的语序错误问题。首先制定了调序规则,然后以此为据进行调序,为形成蒙古语句节自然顺序提供了有力保障。与此同时,采取了相应措施解决了同形附加成分的区分和サ变名词和サ变动词翻译难问题。 (3)对日语功能词语义分析及其蒙古语翻译问题提出了一些看法,在一定范围内解决了功能词翻译难题。 (4)制定句法分析规则,研发了基于派生文法的日语句法分析器。克服了日语句法分析器KNP在一个句节中出现开括号、闭括号、逗号、句号等对符号的处理、句节翻译以及整个句子的翻译带来的负面影响,并实现了日蒙句法分析及转换。 我们在上述研究的基础上实现了日蒙机器翻译系统并进行了评测实验。以测试数据库的30个新闻报道作为对象,用本系统进行了翻译,对其生成的187个句子(评均词数为27.1个)进行了评价。正确翻译句子为150个,准确率达到了80.2%。在句法分析测试中,针对同语料库的310个新闻报道的1519个句子进行自动句法分析,其结果未出现出误。
【学位授予单位】:内蒙古大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:H36;H531
【参考文献】
中国期刊全文数据库 前10条
1 刘群;统计机器翻译综述[J];中文信息学报;2003年04期
2 侯宏旭;刘群;那顺乌日图;;基于实例的汉蒙机器翻译[J];中文信息学报;2007年04期
3 百顺;;基于派生文法的日—蒙动词短语机器翻译研究[J];中文信息学报;2008年02期
4 那顺乌日图;;计算机处理现代蒙古语TAI、TEI形式的尝试[J];民族语文;1991年03期
5 巴达玛敖德斯尔;汉蒙机器翻译中的蒙古语词语法属性描述[J];民族语文;2002年04期
6 敖其尔;从英文到蒙文的机器翻译[J];内蒙古大学学报(哲学社会科学版);1988年03期
7 华沙宝;对蒙古文语料库的词类标注系统——AYIMAG[J];内蒙古大学学报(人文社会科学版);1999年05期
8 华沙宝;现代蒙古文自动校对系统——MHAHP[J];内蒙古大学学报(人文社会科学版);1997年04期
9 德·青格乐图;蒙古语复合词的语法属性描述[J];内蒙古师范大学学报(哲学社会科学版);2003年04期
10 娜步青;;基于统计的蒙汉机器翻译系统研究[J];内蒙古农业大学学报(社会科学版);2006年02期
中国重要会议论文全文数据库 前1条
1 华沙宝;巴达玛敖德斯尔;;蒙古语语料库建设现状分析和完善策略[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前5条
1 额尔敦朝鲁;面向信息处理的蒙古语动词语义研究[D];内蒙古大学;2005年
2 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
3 雪艳;汉蒙词语对齐及相关技术研究[D];内蒙古大学;2009年
4 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
5 张建梅;基于语料库的现代蒙古语简单陈述句句型分析研究[D];内蒙古大学;2010年
中国硕士学位论文全文数据库 前1条
1 吉日木图;基于模板的英蒙机器翻译系统的研究[D];内蒙古大学;2005年
,本文编号:1249916
本文链接:https://www.wllwen.com/waiyulunwen/lxszy/1249916.html