PAGE8
PAGE8
PAGE7
PAGE7
课题
项目三构建传统声学模型
课时
4课时(180min)
教学目标
知识目标:
(1)了解隐马尔可夫模型的基本结构
(2)理解隐马尔可夫模型的基本问题
(3)掌握隐马尔可夫模型在语音识别中的应用方法
(4)了解高斯混合模型的基本原理
(5)理解高斯混合模型—隐马尔可夫模型的基本原理
(6)掌握隐马尔可夫模型的编程实现方法
技能目标:
(1)能够使用HMMlearn库中的隐马尔可夫模块解决问题
(2)能够编写程序,使用高斯混合模型—隐马尔可夫模型进行孤立词的语音识别
素养目标:
(1)学习传统声学模型的基础知识,加强对语音识别技术的了解,培养探索精神
(2)了解时代新科技,培养学生的思维能力和创造能力
教学重难点
教学重点:隐马尔可夫模型的基本结构、基本问题,及其在语音识别中的应用方法;高斯混合模型及高斯混合模型—隐马尔可夫模型的基本原理
教学难点:使用HMMlearn库中的隐马尔可夫模块解决问题;编写程序,使用高斯混合模型—隐马尔可夫模型进行孤立词的语音识别
教学方法
案例分析法、问答法、讨论法、讲授法
教学用具
电脑、投影仪、多媒体课件、教材
教学过程
主要教学内容及步骤
考勤
【教师】使用APP进行签到
【学生】班干部报请假人员及原因
问题导入
【教师】播放“隐马尔可夫模型的起源与发展”视频(详见教材),并提出以下问题:
(1)马尔可夫链是什么?
(2)隐马尔可夫模型主要用于哪些领域?
(3)隐马尔可夫模型的扩展模型有哪些?
【学生】聆听、思考、举手回答
传授新知
【教师】通过学生的回答引入要讲的知识,讲解隐马尔可夫模型,高斯混合模型—隐马尔可夫模型,HMMlearn库中的隐马尔可夫模块,以及隐马尔可夫模块的应用举例等知识
3.1传统声学模型
在语音识别系统中,声学模型起着至关重要的作用,它能够将语音信号映射成对应的音素序列,而音素序列再通过语言模型、发音词典等映射成文本,最终进行语音识别。训练声学模型的传统算法主要有隐马尔可夫模型和高斯混合模型—隐马尔可夫模型。
3.1.1隐马尔可夫模型
1.隐马尔可夫模型的结构
隐马尔可夫模型(hiddenmarkovmodel,HMM)主要用于序列数据(序列数据是一种有顺序的向量数据,数据前后具有关联性,如“今天阴天,可能要下雨,出门最好带伞”就是序列数据)的建模,在语音识别、自然语言处理等领域都有广泛应用。
?【教师】利用多媒体展示“隐马尔可夫模型的结构”图片(详见教材),并进行讲解
隐马尔可夫模型中的变量可分为两组,第一组是状态变量,其中表示第t时刻的系统状态,通常假定状态变量是隐藏的、不可观测的,故状态变量又称隐藏变量;第二组是观测变量,其中表示第t时刻的观测值,如图所示。
图“隐马尔可夫模型的结构”的箭头表示了变量之间的依赖关系。在任一时刻,观测变量的取值仅依赖于状态变量,与其他状态变量及观测变量的取值无关,这意味着观测变量之间是相互独立的。同时,t时刻的状态仅依赖于时刻的状态,与此前其他时刻的状态无关。这就是隐马尔可夫模型的两个关键假设——观测独立性假设和马尔可夫性假设。
……(详见教材)
?【教师】利用多媒体展示“3个不同的骰子”图片(详见教材),并进行讲解
下面用一个简单的例子来描述隐马尔可夫模型及其相关概念。假设有3个不同的骰子,第1个骰子D4有4个面,每个面出现的概率是,第2个骰子D6有6个面,每个面出现的概率是,第3个骰子D8有8个面,每个面出现的概率是,如图所示。
?【教师】利用多媒体展示“掷骰子过程”图片(详见教材),并进行讲解
现在开始掷骰子。掷6次骰子,每次可得到一个数字,最终可能会得到这样一串数字:8、6、3、5、2、7,这串数字是可观测到的结果,可理解为隐马尔可夫模型中的观测变量;而掷骰子过程中用到的骰子的序列(如D8、D6、D8、D6、D4、D8)即为状态变量,如图所示。
在掷骰子过程中,每次掷骰子时,选择D4、D6和D8的概率都是,即从一个状态到下一个状态之间转换的概率为,这个概率即为状态转移概率;如果第一次掷骰子时选中骰子D8,则产生结果1、2、3、4、5、6、7、8的概率都为,这个概率即为输出观测概率。
……(详见教材)
2.隐马尔可夫模型的基本问题
使用隐马尔可夫模型解决实际问题时,人们通常会关注以下3个基本问题。
(1)模型评估问题。在给定模型的情况下,如何计算其产生观测序列的概率,即求模型对观测序列的概率。这个问题即为模型评估问题,其求解方法通常为穷举法或前向—后向算法。
?【教师】随机邀请学生回答以下问题:
前向—后向算法的基本原理是什么?
?【学生】聆听、思考、回答
?【教师】总结学生的回答
前向—后向算法的基本原理是计算模型的前向概率和后向概率,然后再