基本信息
文件名称:自然语言处理导论:机器翻译PPT教学课件.pptx
文件大小:5.67 MB
总页数:63 页
更新时间:2026-02-26
总字数:约小于1千字
文档摘要
1;;;;;;;;;;;;;;;;;;这一展开看似较为复杂,实际上每个部分都具有较为清晰的物理含义。
给定一个目标语言序列t,首先通过概率P(m|t)估计源语言序列的长度m。
接下来,通过m次循环从左向右依次生成源语言序列和它们的词对齐。
在第j次循环当中,首先通过目标语言序列t,前j-1次循环中生成的词对齐序列以及源语言序列产生当前位置的词对齐aj,即
接下来结合aj进一步生成当前位置的源语言单词sj,也即
至此,翻译概率的建模实际上就被转换为源语言文本和词对齐的生成问题;;;;;;