PAGE6
PAGE6
PAGE5
PAGE5
课题
项目七中文普通话语音识别
课时
2课时(90min)
教学目标
知识目标:
(1)掌握语音识别项目的实施流程
(2)掌握语音识别项目中语音数据和标签数据的处理方法
(3)掌握中文普通话语音识别项目中模型的构建方法
(4)进一步掌握CTC解码算法的使用方法
技能目标:
(1)能够导入中文语音数据集,并对数据集进行处理
(2)能够编写程序,构建中文普通话的语音识别系统
(3)能够编写程序,使用CTC解码算法进行解码
素养目标:
(1)培养勇于奋斗、乐观向上的工作态度,提高自我管理能力
(2)养成良好的学习习惯,拥有强健的体魄、健康的心理和健全的人格
教学重难点
教学重点:语音识别项目的实施流程,语音识别项目中语音数据和标签数据的处理方法,中文普通话语音识别项目中模型的构建方法
教学难点:导入中文语音数据集,并对数据集进行处理;构建中文普通话的语音识别系统;使用CTC解码算法进行解码
教学方法
案例分析法、问答法、讨论法、讲授法
教学用具
电脑、投影仪、多媒体课件、教材
教学过程
主要教学内容及步骤
考勤
【教师】使用APP进行签到
【学生】班干部报请假人员及原因
问题导入
【教师】播放“语音的产生和感知”视频(详见教材),并提出以下问题:
(1)什么是语音合成?
(2)请简述语音合成的一般过程。
(3)语音合成的主要方法有哪些?
【学生】聆听、思考、举手回答
项目实施
1.数据准备
【教师】播放“数据准备”视频,讲解并演示相关操作,然后组织学生以小组为单位,进行数据准备的操作
步骤1导入数据处理部分所需的库和模块,并设置忽略警告。
步骤2定义source_get()函数,用于从指定的源文件目录中获取语
音文件的路径列表。
步骤3调用source_get()函数,获取语音文件的路径列表。
……(详见教材)
【学生】观看、聆听、思考、根据要求进行操作,先完成的学生帮助本组其他学生完成操作,如遇问题,可询问教师或自行扫码播放“数据准备”视频
【教师】巡堂辅导,及时解决学生遇到的问题
2.标签数据处理
【教师】播放“标签数据处理”视频,讲解并演示相关操作,然后组织学生以小组为单位,进行标签数据处理的操作
步骤1定义mk_vocab()函数,用于创建词汇表(词汇表中需添加一个特殊标记“_”,表示空白字符)。
步骤2定义word2id()函数,用于返回词汇表中的词对应的索引列表。
步骤3定义列表wav_lst和pin_lst,分别用于存放语音文件名称和每个语音文件对应汉字的拼音。
……(详见教材)
【学生】观看、聆听、思考、根据要求进行操作,先完成的学生帮助本组其他学生完成操作,如遇问题,可询问教师或自行扫码播放“标签数据处理”视频
【教师】巡堂辅导,及时解决学生遇到的问题
3.语音数据处理
【教师】播放“语音数据处理”视频,讲解并演示相关操作,然后组织学生以小组为单位,进行语音数据处理的操作
步骤1定义compute_fbank()函数,用于提取语音特征。
【参考代码】
……(详见教材)
步骤2定义wav_padding()函数,该函数的参数是一个语音数据列表,它可以对语音数据进行填充,将每个语音数据的长度调整为最长语音数据的长度,并返回填充后的语音数据和对应的长度。
【参考代码】
……(详见教材)
步骤3定义label_padding()函数,该函数的参数是一个标签数据列表,它可以对标签数据进行填充,将每个标签数据的长度调整为最长标签数据的长度,并返回填充后的标签数据和对应的长度。
【参考代码】
……(详见教材)
……(详见教材)
【学生】观看、聆听、思考、根据要求进行操作,先完成的学生帮助本组其他学生完成操作,如遇问题,可询问教师或自行扫码播放“语音数据处理”视频
【教师】巡堂辅导,及时解决学生遇到的问题
4.构建模型
【教师】播放“构建模型”视频,讲解并演示相关操作,然后组织学生以小组为单位,进行构建模型的操作
步骤1导入构建模型需要的库和模块。
步骤2定义conv2d()函数、norm()函数、maxpool()函数、dense()
函数和cnn_cell()函数,分别用于创建卷积层、批量标准化层、最大池化
层、全连接层和卷积神经网络中的多个层组成的“单元”。
步骤3定义CTC损失函数ctc_lambda()。
【参考代码】
……(详见教材)
……(详见教材)
【学生】观看、聆听、思考、根据要求进行操作,先完成的学生帮助本组其他学生完成操作,如遇问题,可询问教师或自行扫码播放“构建模型”视频
【教师】巡堂辅导,及时解决学生遇到的问题
5.训练模型
【教师】播放“训练模型”视频,讲解并演示相关操作,然后组织学生以