CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名统计机器解码器的设计与实现
作者柴春光
学位类别工学硕士
答辩日期2007-06-19
授予单位中国科学院研究生院
授予地点中国科学院自动化研究所
导师宗成庆
关键词统计机器翻译 解码器 最小错误率训练 口语翻译 statistical machine translation decoder minimum error rate training spoken language translation
其他题名The Design and Implementation of Decoder for Statistical Machine Translation
学位专业计算机应用技术
中文摘要机器翻译是自然语言处理中的一个重要研究方向。近年来,统计机器翻译取得了很大的成功,基于短语的翻译系统在机器翻译评测中占据了主要地位,并且取得了领先的成绩。最大熵模型可以方便地添加不同的知识源,目前已经成为统计翻译的主流框架。 本文针对统计机器翻译解码器的设计与实现以及统计机器翻译实验平台的建设问题做了相关的研究和探讨,主要内容归纳如下: (1) 实现了最小错误率的参数训练方法 最小错误率的最大熵翻译模型参数训练方法直接以翻译结果的评价标注为优化准则,在一定程度上可以提高参数训练的质量。本方法的实现为实验系统开发和平台建设提供了灵活方便的工具模块。 (2) 设计实现了基于柱搜索的解码器 在解码器实现过程中,充分考虑了算法的执行效率和可扩展性等因素,为统计翻译系统的实现奠定了基础。 (3) 建立了统计翻译系统实验平台 在上述工作和已有技术的基础上,建立了一个统计翻译系统实验平台。该平台提供了丰富的功能选项和接口,为统计翻译系统的深入研究提供了方便。
英文摘要Statistical machine translation (SMT) is one of the most important research fields in natural language processing. In recent years, SMT has shown considerable success, and phrase-based translation models have been suggested to be the state of art by recent empirical evaluations. Now most of SMT systems are based on maximum entropy (ME) model. This thesis is about the design and implementation of an SMT decoder and the building of an SMT experiment platform. The main work is summarized as follows: (1) Minimum Error Rate Training in Statistical Machine Translation Minimum Error Rate (MER) Training improves the performance of the SMT system by directly using the evaluation criteria as the training criteria. The implementation of MER provides a tool for the experiment platform. (2) The Design and Implementation of A Statistical Machine Translation Decoder The efficiency and expansion are considered in the design and implementation of SMT decoder. The decoder is the basic of the experiment platform for SMT. (3) The Experiment Platform for Statistical Machine Translation An SMT experiment platform is built based on the above work and previous technologies. The platform provides plenty of functions and affords a good environment for the researchers of SMT.
语种中文
其他标识符200428014628066
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/7415]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
柴春光. 统计机器解码器的设计与实现[D]. 中国科学院自动化研究所. 中国科学院研究生院. 2007.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace