当前位置:主页 > 文艺论文 > 汉语言论文 >

统计机器翻译基于赫夫曼编码的解码算法

发布时间:2018-05-28 00:07

  本文选题:统计机器翻译 + 解码 ; 参考:《东南大学学报(哲学社会科学版)》2011年06期


【摘要】:赫夫曼树编码是信息论中重要的数据编码方式。根据赫夫曼编码的算法构造最优二叉树,可以得到总长最短的二进制编码。本文首次依据赫夫曼编码的思想设计机器翻译中的解码算法,基本思想是:在栈解码的基础上,不再是在原有结点上扩展新的假设,而是合并原有的假设,最后构造一棵完整的二叉树。这种方法开辟了机器翻译解码的新途径,有望提高机器翻译解码的效率,节约存储空间。
[Abstract]:Huffman tree coding is an important data coding method in information theory. According to the Huffman coding algorithm, the optimal binary tree can be constructed and the shortest binary coding can be obtained. In this paper, the decoding algorithm in machine translation is designed for the first time according to the Huffman coding idea. The basic idea is that, on the basis of stack decoding, the new hypothesis is no longer extended on the original node, but the original assumption is merged. Finally, a complete binary tree is constructed. This method opens up a new way of machine translation decoding, and it is expected to improve the efficiency of machine translation decoding and save storage space.
【作者单位】: 南京师范大学文学院;
【基金】:江苏省2010年度研究生科研创新计划(CX10B_063R) 南京师范大学2010年度优秀博士研究生学位论文培育项目(2010bs0006)成果之一
【分类号】:H085

【相似文献】

相关期刊论文 前10条

1 翟舒;韩习武;;汉英机器翻译中的意译和直译应用[J];外语学刊;2011年04期

2 ;[J];;年期

3 ;[J];;年期

4 ;[J];;年期

5 ;[J];;年期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相关会议论文 前10条

1 刘群;熊德意;刘洋;;基于句法的统计机器翻译研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

2 张大鲲;孙乐;;ISCAS机器翻译和系统融合评测系统介绍[A];机器翻译研究进展——第四届全国机器翻译研讨会论文集[C];2008年

3 杨睿;山本博史;菊井玄一郎;S坂芳典;;针对统计机器翻译的无监督中文文本切分[A];第二届全国学生计算语言学研讨会论文集[C];2004年

4 何中军;刘群;林守勋;;统计机器翻译中短语切分的新方法[A];第三届学生计算语言学研讨会论文集[C];2006年

5 何彦青;周玉;宗成庆;;基于“松弛尺度”的短语翻译对抽取方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

6 付雷;吕雅娟;刘群;;基于句型模板和统计机器翻译技术的翻译方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

7 周玉;宗成庆;徐波;;基于多层过滤的统计机器翻译[A];第二届全国学生计算语言学研讨会论文集[C];2004年

8 史晓东;陈毅东;;基于语篇的机器翻译前瞻[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

9 徐波;宗成庆;;前言[A];机器翻译研究进展——第四届全国机器翻译研讨会论文集[C];2008年

10 张大鲲;张玮;董静;;基于非连续短语的统计翻译模型[A];第三届学生计算语言学研讨会论文集[C];2006年

相关博士学位论文 前2条

1 刘水;融入头—修饰词调序模型的短语统计机器翻译方法研究[D];哈尔滨工业大学;2011年

2 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年

相关硕士学位论文 前1条

1 谭煜辉;基于统计的维文—汉文人名音译方法研究[D];新疆大学;2012年



本文编号:1944370

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/1944370.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户43f9e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com