语音信号的谱减增强法分析综述
目录
语音信号的谱减增强法分析综述 1
1.1语音信号 2
1.2基本谱减法 2
1.3改进型谱减法 5
在1900年,因为当时的声学领域发展十分之快,所以语音信号的增强技术在其可懂度的分析中有着无可厚非的作用。在1960年,随着各种梳状理论和电子计算机的发展,使得语音增强技术可以运用在信号处理领域。在1978年,维纳滤波法的提出进一步推动了语音信号增强算法的发展,维纳滤波法的缺点在于没有对语音的模型进行处理。而卡尔曼滤波可以在不平稳的条件下进行最优估计和算法,解决了维纳滤波法的缺点。在1970年前后,当时的半导体技术不断发展和更新从而使得电子计算机的进行了广泛地运用,最后得到了线性预测编码模型。在1979年,谱相减法由Boll提出,并且该方法是利用噪声的平均谱来进行估计语音中的噪声,这种办法十分方便和有效,是最基本的语音信号增强算法。在此基础之上,后人又提出了许许多多的新型算法,其中基于短时谱的方法应用最为广泛。
在新时代下的实际通信系统中,因为随着多种新的算法不断涌现,使得算法不断前进和优化。由于盲源分离技术和声场景分析技术的不断涌现和发展,可以通过对该混合的语音信号进行分离处理来进行语音增强的目的和处理,使其增强效果变得越来越好5。与此同时,可以通过利用独立分量的分析方法或者时运用数学形态学来改进该增强算法。
噪声
混合系统
混合系统解混系统
分离信
号
源信号混合信号
图1.1盲源分离技术原理图
1.1语音信号
人们在日常生活中通过语音信号等其它方式来进行交流信息。通常需要将语音信号进行变换成电信号才能够在通信系统中进行传输。因为通常而言,语音信号是模拟的,并且语音信号中小信号出现的概率比较大,要进行PCM编码,从而可以保证高质量的语音信号的传输。在本文中通过对语音信号的频谱结构以及时域角度进行了分析说明,从中证明了语音信号的增强方案可行性。
在当今社会中,所获得的所有信号波形都是其对应分布的一组观测值。平稳信号指的是其分布及分布的参数不会发生变化,非平稳信号则是其分布或分布的参数发生变化。对于语音信号来说,由于信号直接由说话者控制,其分布的类型和分布的参数都是不确定的,因为这些不确定性造成语音信号是一个非平稳的过程,并且语音信号中小信号出现的概率比较大6。以一个宏观的角度来看,语音信号具有非平稳性。而在这个尺度,受人的发声器官所限定,即在微观的角度来说语音信号是一个平稳的过程。正是由于这种特性,可以使得语音信号在实际处理过程中,把该语音信号可以当作一个平稳过程,从而对该语音信号进行短时谱的分析和计算[71。
1.2基本谱减法
首先先介绍语音信号增强的基本型谱减法的原理思路:因为在日常的语音信号交流中,大多数的语音信号中都是夹杂背景噪声,即是不纯净的。进行语音信号增强第一步是将带噪声的语音信号(时域)通过傅里叶变换从而能够转化到频域上,接下来就可以估计语音信号的噪声谱,然后进行语音信号的增益函数的计算,即能获得噪声谱和纯净语音信号的功率谱,通过相减的运算,将带噪的语音信号谱进行减去的操作,即可获得了纯净语音信号的功率谱。最后将纯净的语音信号功率谱进行傅里叶反变换的操作,即可获得到纯净的时域的语音信号。通过以上操作步骤,就是谱减法的流程。通过谱减法即可对带噪的语音信号进行提纯和增强信号的作用。
估计噪声谱
估计噪声谱增益函数计算傅里叶变换相减计算傅里叶反变换
图1.2谱减法降噪的基本原理框图
假定不纯净的语音信号是y(n),y(n)是由纯净的语音信号x(n)和加性噪声d(n)所构成的,如下式(1.1)所示。
y(n)=x(n)+d(n)(1.1)
同时做傅立叶变换可以得到式(1.2)。
Y(w)=X(w)+D(w)(1.2)
用功率谱密度可以写为式(1.3)。
IY(w)I2=|X(w)I2+|D(w)I2+2Re{X(w)D(w)}(1.3)
式中2Re{X(w)D(w)}为交叉项,假定d(n)与x(n)不相关,并且它具有零均值,所以交叉项即为零,上式则可以简化为式(1.4)。
|Y(w)I2=|X(w)I2+|D(w)I2
(1.4)
将式