基本信息
文件名称:第五章机器翻译实践代码:统计机器翻译实践.pdf
文件大小:1.15 MB
总页数:72 页
更新时间:2026-04-01
总字数:约15.08万字
文档摘要

第五章机器翻译实践代码

5.3.2统计机器翻译实践

1

本部分将以汉英翻译为例,介绍利用Moses工具包训练SMT的实践细节。

首先设置训练模型的根目录为~/mosesdecoder。汉语数据和英语数据分别包括训

练集、开发集(验证集)和测试集三个部分。

汉英训练集的文件名为train.zh和train.en,开发集的文件名为dev.zh和

dev.en,测试集的文件名为tes