语音信号的谱减增强法分析综述
目录
语音信号的谱减增强法分析综述1
1.1语音信号2
1.2基本谱减法2
1.3改进型谱减法5
在1900年,因为当时的声学域发展十分之快,所以语音信号的增强技术
在其可懂度的分析中有着无可厚非的作用。在I960年,随着各种梳状理论和电
子计算机的发展,使得语音增强技术可以运用在信号处理域。在1978年,维
纳滤波法的提出进一步推动了语音信号增强算法的发展,维纳滤波法的缺点在于
没有对语音的模型进行处理。而卡尔曼滤波可以在不平稳的条件下进行最优估计
和算法,解决了维纳滤波法的缺点。在1970年前后,当时的半导体技术不断发
展和更新从而使得电子计算机的进行了广泛地运用,最后得到了线性预测编码模
型。在1979年,谱相减法由Boll提出,并且该方法是利用噪声的平均谱来进行
估计语音中的噪声,这种办法十分方便和有效,是最基本的语音信号增强算法。
在此基础之上,后人又提出了许许多多的新型算法,其中基于短时谱的方法应用
最为广泛。
在新时代下的实际通信系统中,因为随着多种新的算法不断涌现,使得算法
不断前进和优化。由于盲源分离技术和声场景分析技术的不断涌现和发展,可以
通过对该混合的语音信号进行分离处理来进行语音增强的目的和处理,使其增强
效果变得越来越好⑸。与此同时,可以通可利用独立分量的分析方法或者时运用
数学形态学来改进该增强算法。V
噪声
□
源信号混合信号
图1.1盲源分离技术原理图
1.1语音信号
人们在日常生活中通过语音信号等其它方式来进行交流信息。通常需要将语
音信号进行变换成电信号才能够在通信系统中进行传输。因为通常而言,语音信
号是模拟的,并且语音信号中小信号出现的概率比较大,要进行PCM编码,从
而可以保证高质量的语音信号的传输。在本文中通过对语音信号的频谱结构以及
时域角度进行了分析说明,从中证明了语音信号的增强方案可行性。
在当今社会中,所获得的所有信号波形都是其对应分布的一组观测值。平稳
信号指的是其分布及分布的参数不会发生变化,非平稳信号则是其分布或分布的
参数发生变化。对于语音信号来说,由于信号直接由说话者控制,其分布的类型
和分布的参数都是不确定的,因为这些不确定性造成语音信号是一个非平稳的过
程,并且语音信号中小信号出现的概率比较大⑹。以一个宏观的角度来看,语音
信号具有非平稳性。而在这个尺度,受人的发声器官所限定,即在微观的角度来
说语音信号是一个平稳的过程。正是由于这种特性,可以使得语音信号在实际处
理过程中,把该语音信号可以当作一个平稳过程,从而对该语音信号进行短时谱
的分析和计算⑺。
1.2基本谱减法
首先先介绍语音信号增强的基本型谱减法的原理思路:因为在日常的语音信
号交流中,大多数的语音信号中都是夹杂背景噪声,即是不纯净的。进行语音信
号增强第一步是将带噪声的语音信号(时域)通过傅里叶变换从而能帽转化到频
域上,接下来就可以估计语音信号的噪声谱,然后进行语音信号的增益函数的计
算,即能获得噪声谱和纯净语音信号的功率谱,通过相减的运算,将带噪的语音
信号谱进行减去的操作,即可获得了纯净语音信号的功率谱。最后将纯净的语音
信号功率谱进行傅里叶反变换的操作,即可获得到纯净的时域的语音信号。通过
以上操作步骤,就是谱减法的流程。通过谱减法即可对带噪的语音信号进行提纯
和增强信号的作用。
图1.2谱减法降噪的基本原理框图
假定不纯净的语音信号是y(n),y(n)是由纯净的语音信号x(ti)和加性噪声
d(zi)所构成的,如下式(1.1)所示。
y(n)=x(n)+d(n)(1.1)
同时做傅立叶变换可以得到式(1.2)o
K(w)X