PAGE10
PAGE10
PAGE9
PAGE9
课题
项目五训练语言模型
课时
4课时(180min)
教学目标
知识目标:
(1)理解语言模型的基本概念
(2)理解N-gram语言模型的基本原理
(3)了解常用的平滑算法,包含拉普拉斯平滑、Good-Turing平滑、Katz平滑和Kneser-Ney平滑
(4)了解语言模型的评价指标
(5)掌握N-gram语言模型的编程实现方法
(6)理解循环神经网络语言模型的基本原理
(7)掌握循环神经网络语言模型的编程实现方法
技能目标:
(1)能够编写程序,使用N-gram语言模型解决实际问题
(2)能够编写程序,使用循环神经网络训练语言模型
素养目标:
(1)学习语言模型基础知识,加强对新技术的了解,培养勇于尝试的精神
(2)了解时代新科技,培养探索精神
教学重难点
教学重点:语言模型的基本概念,N-gram语言模型的基本原理,常用的平滑算法,语言模型的评价指标,循环神经网络语言模型的基本原理
教学难点:N-gram语言模型的编程实现方法,循环神经网络语言模型的编程实现方法
教学方法
案例分析法、问答法、讨论法、讲授法
教学用具
电脑、投影仪、多媒体课件、教材
教学过程
主要教学内容及步骤
考勤
【教师】使用APP进行签到
【学生】班干部报请假人员及原因
问题导入
【教师】播放“语言模型”视频(详见教材),并提出以下问题:
(1)通俗来讲,语言模型是什么?
(2)语言模型的应用领域有哪些?
(3)语言模型可分为哪两类?
【学生】聆听、思考、举手回答
传授新知
【教师】通过学生的回答引入要讲的知识,讲解语言模型的基本概念,N-gram语言模型的基本原理,常用的平滑算法,语言模型的评价指标,N-gram语言模型的编程实现方法,循环神经网络的基本原理,循环神经网络语言模型的基本原理,以及循环神经网络语言模型的编程实现方法等知识
5.1语言模型概述
语言模型是用于评估文本序列符合人类语言使用习惯程度的模型。它基于概率论和统计学原理,通过大量的文本数据训练而成,能够估计出给定上下文中下一个词的概率分布。这种概率分布的建模使得语言模型能够在文本生成、自动摘要、机器翻译等任务中发挥重要作用。
在语音识别系统中,通过声学模型能够将语音特征映射为音素序列,而音素序列相同的词可能有多个,那么,语音识别系统应该将这个音素序列识别为哪个词呢?这就需要语言模型对句子出现的概率进行计算。……(详见教材)
一般地,语言模型表示一个句子的概率可用如下方法。若给定一个长度为i的词序列,该词序列组成一个句子W,则该句子的概率可表示为
其中,条件概率,,,,就是语言模型的参数,计算出这些参数的值就可以得到句子的概率。通常,训练语言模型的算法主要有N-gram语言模型和循环神经网络语言模型。……(详见教材)
5.2N-gram语言模型
5.2.1N-gram语言模型的基本原理
N-gram?语言模型是一种常见的统计语言建模方法,也是自然语言处理中一种基础的语言模型,它是通过文本中N个词出现的概率来推断语句结构的一种算法。
N-gram语言模型中的“N”表示模型考虑的上下文的词语数量,需要根据具体任务和语料库的大小来选择,较大的N能够考虑更长的上下文信息,但也会增加模型的复杂度和参数数量,解码速度也会变慢。当时,相应的模型分别称为一元模型、二元模型和三元模型,下面通过一个具体的例子分别对这3个模型进行介绍。
假设给定分词后的句子语料库如下:
①“今天想去健身”。
②“但今天是阴天”。
③“每天都可以运动”。
④“喝蛋白粉可以长肌肉”。
⑤“想喝水”。
该语料库中有5个句子,共20个词。下面分别使用一元模型、二元模型和三元模型对句子的概率进行计算。
1.一元模型
当时,该语言模型称为一元模型(unigram模型)。此时每个词都相互独立,即每个词出现的概率都与前面的词无关。可见,一元模型没有引入“语境”,对句子的约束最小。一元模型中句子概率的计算方法为。其中,每个词的概率的计算方法为“该词在语料库中出现的次数与语料库总词数的比值”。例如,使用一元模型计算句子“今天想喝蛋白粉”的概率,其计算过程如下。
2.二元模型
当时,该语言模型称为二元模型(bigram模型)。此时当前词出现的概率仅与前一个词有关,即一个词的出现仅依赖于它前面出现的一个词,与其他词无关,故二元模型中句子概率的计算方法为。例如,使用二元模型计算句子“今天想喝蛋白粉”的概率,其计算过程如下。
?【教师】随机邀请学生回答以下问题:
的含义是什么?
?【学生】聆听、思考、回答
?【教师】总结学生的回答
的含义是计算在给定词是的情况下,下一个词是的概率,它的计算方法为这个二元组在语料库中出