基本信息
文件名称:第五章机器翻译实践代码:统计机器翻译实践.pdf
文件大小:1.15 MB
总页数:72 页
更新时间:2026-04-01
总字数:约15.08万字
文档摘要
第五章机器翻译实践代码
5.3.2统计机器翻译实践
1
本部分将以汉英翻译为例,介绍利用Moses工具包训练SMT的实践细节。
首先设置训练模型的根目录为~/mosesdecoder。汉语数据和英语数据分别包括训
练集、开发集(验证集)和测试集三个部分。
汉英训练集的文件名为train.zh和train.en,开发集的文件名为dev.zh和
dev.en,测试集的文件名为tes