基本信息
文件名称:《语音识别技术及应用》教案 项目二 语音特征提取.docx
文件大小:1.81 MB
总页数:9 页
更新时间:2025-05-26
总字数:约1.01万字
文档摘要

PAGE8

PAGE8

PAGE9

PAGE9

课题

项目二语音特征提取

课时

8课时(360min)

教学目标

知识目标:

(1)了解语音特征的提取流程

(2)理解预加重、分帧和加窗的基本原理及其实现方法

(3)理解短时傅里叶变换的基本原理和实现方法

(4)掌握语谱图特征的提取方法

(5)掌握Fbank特征的提取方法

(6)掌握MFCC特征的提取方法

技能目标:

(1)能够编写程序,完成语音数据的预处理操作

(2)能够编写程序,对语音数据进行短时傅里叶变换

(3)能够编写程序,提取语音数据的语谱图、Fbank和MFCC特征

素养目标:

(1)学习语音数据预处理和语音特征提取的相关技术,提升逻辑推理能力

(2)掌握不同语音特征的提取方法,形成知识体系,培养系统思维

教学重难点

教学重点:语音特征的提取流程,预加重、分帧和加窗的基本原理及其实现方法,短时傅里叶变换的基本原理和实现方法

教学难点:语谱图特征、Fbank特征和MFCC特征的提取方法

教学方法

案例分析法、问答法、讨论法、讲授法

教学用具

电脑、投影仪、多媒体课件、教材

教学过程

主要教学内容及步骤

考勤

【教师】使用APP进行签到

【学生】班干部报请假人员及原因

问题导入

【教师】播放“语音的产生和感知”视频(详见教材),并提出以下问题:

(1)哪些噪声会对语音信号的识别产生影响?请列举两种。

(2)如何在语音信号中有效去除噪声?

(3)去除噪声后的语音信号有什么特点?

【学生】聆听、思考、举手回答

传授新知

【教师】通过学生的回答引入要讲的知识,讲解语音特征的提取流程,语音数据预处理,短时傅里叶变换,以及语音特征的提取等知识

2.1语音特征的提取流程

原始的语音信号是不定长的时域信号,一般需要将其转换为特征向量,才能用于语音识别任务,这个转换过程称为语音特征提取。随着深度神经网络技术的发展,虽然原始语音信号也可以作为网络的输入,但是对深度神经网络提出了更高的要求。因此,语音特征提取仍是语音识别的关键技术之一。

?【教师】利用多媒体展示“提取语音特征的一般流程”图片(详见教材),并进行讲解

在语音识别领域中,常见的语音特征有语谱图特征、Fbank特征和MFCC特征。提取这些特征的一般流程如图所示。

可见,提取3个语音特征之前,都需要经过预加重、分帧、加窗、短时傅里叶变换等步骤,然后各自再进行不同的处理。其中,语谱图特征需要进行取对数操作,Fbank特征需要经过梅尔滤波器组后再取对数,而MFCC特征是在Fbank特征的基础上进行离散余弦变换得到的特征。

2.2语音数据预处理

2.2.1预加重

1.预加重的基本原理

在音频采集过程中,由于传感器和麦克风等设备的特性,高频部分容易受到衰减,导致信号在这些频率上的能量相对较低,影响语音识别的准确性。为了抵消这种效应,可采用预加重的方法补偿语音信号高频部分的振幅。

假设输入语音第n个采样点的信号为,则预加重的公式为

……(详见教材)

?【教师】随机邀请学生回答以下问题:

什么是高通滤波,其基本规则是什么?

?【学生】聆听、思考、回答

?【教师】总结学生的回答

高通滤波是一种过滤方式,规则为高频信号能正常通过,而低于设定临界值的低频信号则被阻隔、减弱。高通滤波器是一种允许高频信号通过、削弱或阻塞低频信号的信号处理滤波器,它去掉了信号中不必要的低频成分,可理解为去掉了低频干扰。

2.预加重的编程实现

Librosa库中的preemphasis()函数可对语音信号进行预加重处理,其语法格式如下。

librosa.effects.preemphasis(y,coef=0.97)

其中,y表示要处理的语音信号;coef表示预加重系数。Librosa库在使用之前需要安装,安装方法如下:①在“运行”窗口中输入命令“cmd”,然后单击“确定”按钮;②在弹出的窗口中输入命令“pipinstalllibrosa”,按“Enter”键即可自动安装Librosa库。

【例2-1】导入语音文件“SN0001.wav”(见本书配套素材“item2/SN0001.wav”),并对其进行预加重处理,然后绘制处理前后的波形图。

【程序分析】使用Librosa库中的load()函数导入语音文件“SN0001.wav”,然后使用preemphasis()函数对其进行预加重处理,最后使用Matplotlib库绘制处理前后的波形图。注意:在编写程序之前,须将“SN0001.wav”文件复制到当前工作目录中,若没有复制,则读取数据文件时要指定相应路径。

【参考代码】

……(详见教材)

?【教师】利用多媒体展示“预加重前后波形图对比”图片(详见教材),并进行讲解

【运行结果】程序运行结果如图所示。

【程序说明】ti