当前位置:主页 > 科技论文 > 自动化论文 >

基于神经网络的彝汉翻译研究与实现

发布时间:2020-12-26 22:14
  沟通是人类社会生活的润滑剂,良好的沟通可以提高工作效率,促进社会和谐发展。而我们能良好沟通的前提是我们懂得对方的语言。中国是一个多民族多语言的国家。很多时候,两个语言不同、又没学过对方语言的人很难直接沟通。为了促进各民族之间的相互了解,我们有必要研究各民族语言间的翻译。同时还能保护和发扬少数民族传统文化,助力早日实现伟大复兴的中国梦。彝族是分布在我国西南地区的一个少数民族,彝文也是我国的古老文字之一。为了解决彝族地区民族融合过程中存在的交流沟通困难问题,促进彝族地区的经济文化发展。同时为了更好地发扬优秀的彝族传统文化。借助近几年发展迅速的深度学习技术,本文开展了彝文相关的神经机器翻译研究工作,实现了从彝语到汉语的神经机器翻译。本文的主要工作分为以下三个部分:(1)为了完成彝汉神经机器翻译任务,本文系统学习了神经机器翻译相关技术。鉴于没有相关的彝文语料库。本文收集整理彝文资料做成20万的彝语单语语料,基于词和彝文古诗的7万对彝汉互译语料库。然后用收集的彝文词汇在彝文单语语料上统计词频制作词频表,根据频数权重抽取彝文词汇构造带标签的伪彝文句子,训练双向LSTM模型用来预测句子标签,最后结合... 

【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校

【文章页数】:79 页

【学位级别】:硕士

【部分图文】:

基于神经网络的彝汉翻译研究与实现


用户界面展示

彝语,示例,译文


电子科技大学硕士学位论文58图5-7用户界面展示5.5.2翻译效果展示为了展示本系统的翻译效果,本文选用《汉彝翻译技巧探微》中的两个汉彝翻译示例,通过系统译文和参考译文对比的方式来展现。翻译示例一(如图5-8所示):输入彝文:,,,。系统译文:兔子喜欢吃绿色食物,像青草,蔬菜,萝卜。参考译文:兔子喜吃绿色植物,如青草、蔬菜、萝卜等。图5-8彝语翻译示例(一)翻译示例二(如图5-9所示):

彝语,示例


第五章机器翻译系统设计与实现59输入彝文:40℃,,,,,。系统译文:小孩皮肤热40℃以上,抽筋容易,这样在医生话指引下,马上应该找皮肤热压的方法,像旁边冷毛巾贴上,皮肤热打针这样。参考译文:婴幼儿发热到40℃左右,容易引起抽筋,应在医生指导下及早采取有效的退热方法,如头上敷冷毛巾、打退热针等。图5-9彝语翻译示例(二)从两个翻译示例可以看出,本系统对简短语句的翻译具有一定的可靠性。对于长语句,虽然能够提供一定的源语信息,但由于彝汉语的语法结构等方面存在较大差异,翻译结果不尽如人意。当对彝汉翻译准确性要求不是很高的时候,可以运用本系统来获取彝文信息。本章小结本章利用第三章提出的结合复值词嵌入法、基于TransformerXL的双编码器双解码器翻译模型,根据第四章翻译对比试验,采取翻译效果最好的弱监督学习方式训练的模型实现彝语到汉语的翻译。详细描述了彝汉神经机器翻译系统的实现过程。从系统总体架构各层次的划分及功能定义,各层次包含的功能模块以及模块之间的逻辑关系。到系统开发所用的功能软件以及翻译系统的部署、翻译高效性和鲁棒性测试,最后对翻译系统的翻译界面进行展示。

【参考文献】:
期刊论文
[1]基于Bi-LSTM-6Tags的智能中文分词方法[J]. 王玮.  计算机应用. 2018(S2)
[2]彝文信息处理自动分词技术的研究现状与难点分析[J]. 王成平.  电脑知识与技术. 2012(04)
[3]统计机器翻译综述[J]. 刘群.  中文信息学报. 2003(04)
[4]机器翻译的历史和现状[J]. 冯志伟.  国外自动化. 1984(04)

硕士论文
[1]基于神经网络的维汉翻译研究与实现[D]. 杨洋.电子科技大学 2019
[2]基于句法规则的彝汉双语调序模型研究[D]. 王正丽.贵州大学 2016
[3]基于机器学习的少数民族语言翻译关键技术研究与实现[D]. 文佳胜.电子科技大学 2016
[4]基于最大熵的机器翻译研究与实现[D]. 应志野.电子科技大学 2016



本文编号:2940542

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2940542.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户168ed***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com