基于一阶差分传声器阵列频域LMS语音增强算法

堕童堡查(v2

凹@6@@可@@嗡响⑨0⑨回U

文章编号:11102—8684{2010108--0053-04

基于一阶差分传声器阵列频域

LMS语音增强算法・

王扇珍,宋辉,刘加

(清华大学电子工程系,清华信息科学与技术国家实验室(筹),北京100084)

・论文・

【摘要】由于语音通信设备的广泛应用和小型化要求,消除其中的噪声干扰成为重点研究内容。采用了一种双通道的

语音增强算法。该方法基于一阶差分传声器阵列,并利用频域的最小均方误差自适应算法实现噪声消除。仿真结果表明。所采用的方法相对于时域自适应过程,加快了收敛速度,减小了计算量,并改善了噪声消除的效果,可更好地用于实际。【关键词】语音增强;一阶差分传声器阵列;频域LMS【中图分类号】TN912

First-orderDifferential

【文献标识码】A

Microphone

ArrayBased

on

FLMSAdaptiveSpeechEnhancementMethod

WANGShanzhen,SONGHui,LIUJia

(TsinghuaNationalLaboratoryforInformationScienceandTechnology,DepartmentofElectronicEngineering。

TsinghHa

University,Bering

widelyandbecome

00084,China)

【Almraet】As

become

on

communicationdevicesused

more

important.A

moreportable,theresearchofnoiseeliminationhasenhancementalgorithm

uses

moreand

dual-microphonespeech

is

proposed,which

isbased

the

FDM(First-orderDifferentialMicrophone)array,and

the

FLMS(1eastmeansquareadaptivealgorithm

in

frequency

domain)tocancelthenoise.Simulationsshowthatthismethodhasfasterconvergencespeedcompared

algorithmintime

call

with

theadaptivedomain,decreasestheamountofcalculation,andimprovestheperformanceof

inpracticalapplications

moresuitably.

noiseelimination.Soitbe

used

【Keywords】speech

enhancement;FDMarray;FLMS

前言

语音增强技术通过消除噪声干扰以提高语音通信

能达到较好的消噪效果[gl,因而无法满足设备小型化的

需要。而FDM技术在实现过程中仅需2个传声器,阵列结构简单,因而具有更广泛的应用领域,笔者的研究是针对双传声器的语音增强技术。

FDM阵列波束形成技术借鉴了声学方向性传声器的相关原理。利用不同的时延声音信号在传声器的振动膜两边振动产生压力差,也就是相当于两信号相减,而时延越大,压力差越大,输出信号就越强。

传统的自适应滤波器主要是在时域中实现。时域

最小均方误差(LeastMeanSquare,LMS)的优点是结

的质量,也可作为预处理来改善语音识别系统的稳健性。根据语音增强中所采用传声器数目的不同,可分为单通道语音增强和多通道语音增强IlI。谱减法[21及其改进方法M是普遍采用的单通道语音增强技术。然而,由于实际应用环境中信号复杂多变(方向性噪声、混响等),单通道语音增强系统已证明不再适用。于是便提出了传声器阵列语音增强方法,其方法包括了延迟和波束形成(Delay

and

Sum

Beamforming,DSB)[51、广义

旁瓣抵消(GeneralizedSidelobeCanceller,GSC)161、一

DifferentialMicrophone。

构简单,算法复杂度低,易于实现,稳定性高;缺点主要是收敛速度较慢,因而其应用也受到一定的限制。为了解决这些问题,常采用变换域LMS算法代替时域LMS

阶差分传声器FDM(First--order

FDM)阵列川。前两种方法通常需要大数量的传声器才

幸【基金项目】国家自然科学基金委员会与微软亚洲研究院联合资助项目60776800;国家自然科学基金委员会与香港研究资助局联合科研基金资助项目60931160443;国家高技术研究发展计划(863计划)项目(2006AA010101.2007AA042223,2008AA02

Z414,2008AA040201)

万方数据

皇枣熊羹婴堕蔓塑查蔓塑塑匡习

cr19(】)孚nat锆c

算法。变换域LMS算法的基本思想是:先对输入信号进行一次正交变换以去除或衰减其相关性,然后将变换后的信号加到自适应滤波器以实现滤波处理,从而改善相关矩阵的条件数。因为离散傅立叶变换本身具

有近似的正交性,加之有F盯快速算法,故频域LMS

(FLMS)算法被广泛应用。

2算法描述

2.1

FDM阵列语音增强

G.W.Elko和A.T.N.Pong在1995年提出FDM阵列技术171。它由2个或多个全向性传声器组成,基本工作原理与声学方向性传声器类似,通过前后2个传声器接收到的信号延迟差形成期望信号方向的心形波束,并在背对声源的方向形成零点。它最大的优点是结构小巧、实现简单。但为改变其波束零点就需要产生可变的时间差,这给实际的实现造成了困难。于是便产生了自适应波束形成技术,其框图如图l所示。

图中,Xl(n),X2(n)分别为2个传声器接收到的信

号,即

戈l(£)哥(t)*^l(f)抑l(£)(1)X2(f)=s(£)*^2(£)抑2(f)

(2)

式中,s(t)为期望语音信号,^;(£)(i=1,2)为声源到达每个传声器的脉冲响应,Xi(£)和Vi(£)(i=1,2)分别为各传声器接收到的带噪语音和噪声信号,在不考虑声学反射的条件下,式(1)一(2)可简化为

戈l(f)鄙(£)切l(f)

(3)髫1(f)=s(t吖)抑2(t)(4)

式中,r为声源信号到达的时间差。对远场信号,声音到达2个传声器的时间差为"r=(dcosO)/c。

在FDM模型中,Xf(f),魂(£)为t时刻经过一阶差分结构后的前向和后向心形波束所接收到的信号,即

xf(t)=x1(£)叫2(t-T)(5)氟(t)爿2(£)叫l(t-T)

(6)

在该系统中延迟r取固定的值的d/c,其中d为传声器间距,c为声速。经短时傅里叶变换可得自适应

万方数据

FDM阵列系统的传递函数

日仉啦2je-J,,一{sint宵,f-cd(1+cos0)]--/3sin【畦(1一

COSp)】}

(7:

可得其幅值

IH∽0)l=

sinf移罟(1+c。sp)】币si巾哮(1-c。s日)】I

(8:

波束的零点p枷可通过令式(7)为零得到,此时

‰…。s【斋…n‰删08l亩删扑‘蔚诅n芋’I

当阵列间距d和延时单元r都很小的情况下,茧(9)可近似为

‰一arcc。s钴1(101

通过自适应滤波使得该系统可自适应的调整心琵

零点的指向,从而自动跟踪空间中的噪声源,并消除啤

声。其波束方向如图2所示,通过改变届的值就可改委

波束零点指向。

270。

图2一阶背对背心形系统波束形成图

2.2

FLMS算法

频域LMS算法191是在自适应滤波之前先把输入作

号变换到频域,然后在频域上实现自适应滤波处理。硇

FLMS算法中,将输入信号戈(n)和期望信号d(n)分另分割成Ⅳ长(自适应滤波器的权数)的数据块,然后储Ⅳ点快速傅里叶变换(FFT),每个FFl’变换的输出签成Ⅳ个复数点X(k)和D(k),具有权系数矢量W(k

的输出

V(k)靠(_|})xW(后)

(11

式中,第k个数据块的频域权系数矢量w(k)和输入靠

号F丌系数的对角线矩阵X(后)分别定义为

W1(k)=【形。(||})形z(||})…形。(I|})】

国堕妻墼箜垫!Q生蔓丝鲞蔓塑塑

X忌、,

0“0

X/~蠡

、,f|

●●

;0

。舢;o

…XⅣ(J|})

频域自适应滤波器的计算误差

E(.|})=D(.j})-Y(k)

(12)

频域LMS自适应滤波器权系数的更新公式为

W(矗+1)=W(I|})懈(I|})占(J|})

(13)

式中,p为步长控制因子,将式(11)~(12)带入式(13)

中,得

W(k+1)=W(1j})堆畔(k)D(k)-X"(k)x(k)w(k)】

(14)

为保证算法收敛及算法的稳定性,p必须保证

0</z<亡

式中,A。为频域中输入信号的自相关矩阵巩中的最

大特征值。

权系数的更新每Ⅳ个样点进行一次,而每次的更新是,v个误差信号样点累加结果控制。这既保证了收敛速度,同时可利用快速FF-I.技术,用序列的循环卷积来计算线性卷积,从而大幅度减少运算量。3

仿真试验

通过计算机仿真试验验证算法的有效性。在仿真

试验中,传声器阵列由间距为d=4.25cm的2个全指向性传声器组成,语音信号的采样频率为8kHz,将期望声源(纯净语音信号)位于阵列的00方向。所用语音

声源为预先录制的3.75s长的信号。方向性干扰分别取NOISEX92的babble噪声和white噪声。

图3示出了所用的纯净语音信号、babble噪声和white噪声信号。

0j鹫

--o

采样点数/104

嚣。姻瓣辫瓣耨嘲渊鳓鹣测

1.o一一~—型璺始语音,——

O.5

1.0

1.5

2.O

2.5

3.O

采样点数,l04

墨。酗岬酬嗍礴枷㈣蚓嗍涮渺蝌娜哪嘲

.。

(b)white噪声

u・)厂————————————————————————————]

一O.5L—————————』——————————L—————————‘————.————J—————————J———————-'

0.51.01.52.02.53.0

采样点数,l04

(c)babble噪声

图3原始语音和噪声信号

万方数据

凹⑥6@@

试验中,分别将white噪声或babble噪声位于600,90。和1200,传声器阵列同时接收语音信号和噪声信号,在一定的信噪比下合成带噪语音信号。图4示出了当噪声源(white噪声或babble噪声)位于120。时,其中一个传声器所接收到的语音信号。

从图4可看出,此时传声器阵列所接收到的语音信号已属于噪声非常恶劣的情况。采用笔者提出的FDM阵列的频域LMS算法进行语音增强的试验仿真,图5-6分别示出了当white,babble噪声源位于600,900和1200时的语音增强结果。

迥馨

-o

采样点数门04

O5

O5

0.51.o1.52.o2.53.0

采样点数/l04

(c)1200

图5white噪声源位于不同方位时的语音增强结果

4试验结果分析及结论

噪声源分别位于不同方向便于分析算法对不同方

向噪声的抵消能力,而通过采用不同的噪声源可验证

笔者提出的算法对不同噪声的抑制能力。从仿真结果来看,即使在很恶劣的噪声环境下,针对不同噪声在不

塑撞煎型箜蔓翌堂蔓堂国

nn语音技术

W⑨6@@可⑧@晌响⑨0⑨⑨妙

嚣。卜_{—枷’—卜叫——-扣—★叫

1.0厂———————————————————]

-1’吁——菇——而——菇——云广—葛一。

采样点数/104

采霉产1数20004

(c)

图6babble噪声源位于不同方位时的语音增强结果

同方位时仍能取得很好的增强效果,从而验证了算法的有效性。

通过仿真可看出,在算法的开始阶段会有一段短暂的收敛过程,而相对于时域LMS算法来说,频域LMS算法在噪声消除过程中有更快的收敛速度。但由于在算法中对权系数的调整由Ⅳ个误差信号样点累加结果控制,每次的调整量很大,尤其在权向量的初始值为全0的情况下,若步长选取过大,就较易导致算法的发散,故要通过周围环境的噪声来决定所用的步长大小。在保证算法收敛的情况下,从语音增强的结果来看,取得了很好的噪声消除的效果。

在算法的计算复杂度方面,基于频域LMS的自适应算法先对输入信号进行频域变换,然后再用LMS算法实现在频域的自适应波束形成。相比于时域LMS,频域LMS算法增加了FFr的额外计算量。但频域变换都有快速算法,计算量不大。经过对算法分析,对于每Ⅳ点的输入序列,FLMS算法需要5个2N点的FFTr(包含WFT)计算和2个2N点的复数相乘。每个Ⅳ点FFTr

需要芸InN个复数乘法,对于实输入序列由于DFT的

对称特性,又可将运算量减半。对于时域的LMS算法,共需要2胪个实数乘法。每个复数乘法按4个实数乘法计算,则FLMS的运算量与LMS的运算量的比值可近似为(51nN+4)/N,这也从在仿真试验中运行不同的程序所需要时间上得到了证明。

笔者将FDM阵列技术与频域的自适应算法相结合,提出了一种双传声器语音增强算法。该算法能够通

过在频域里自适应调节波束形成的零点,从而达到消

除噪声的目的。通过试验仿真和算法分析证明,笔者算

万方数据

法在消除噪声的同时,计算量更小,收敛速度更快,因此也更容易实现小型化应用。

参考文献

【1】崔玮玮,曹志刚,苏泳涛.基于FDM阵列技术的双通道

语音增强算法叨.清华大学学报。2008,48(7):l135-1139.

[2】BOLL

SF.Suppressionofacousticnoiseinspeechusing

spectral

subtraction[J].IEEE

Trans.on

Acoustics,Speech

andSignalProcessing,1979,27:113-120.

【3】职振华,马建芬.改进的谱减法在语音增强中的应用们.

电声技术,2008,32(2):46-48.【4】KAMATH

S,LOIZOUP.Amulti-bandspectralsubtrac—

tion

methodforenhancingspeech

corrupted

by

colored

noise[C]//Proceedingsof

IEEEInternationalConference

on

Acoustics,Speech,andSignalProcessing.Orlando:IEEEPress,2002:675—678.

【5】5

FLANAGAN

JL.Computer-steeredmicrophonearraysfor

soundtranaductionin

large

rooms[J].Journal

ofAcoustic

SocietyofAmerica,1985,78:1508-1518.

【6】GRIFFITHS

LJ,JIMCW.Analternativeapproach

tolin—

earlyconstrainedadaptivebeamforming[J].IEEETram.on

AntennasPropagation,1982,30:27-34.

【7】ELKO

W,PONGATN.Asimpleadaptivefirst-order

differentialmicrophone【c]//Proceedings

ofIEEE

ASSPworkshop

on

Applicationsof

Signal

Processing

to

Audio

andAcoustics.NewPaltz:IEEEPress,1995:169-172.

【8】魏建强.基于小数量麦克风的语音增强算法研究【D】.北

京:中国科学院声学研究所,2005.【9】9

何振哑.自适应信号处理fM】.北京:科学出版社,2002.

作者简介

王扇珍,硕士研究生,主要研究方向为传声器阵列语音增强算法研究;

宋辉,博士研究生,主要研究方向为传声器阵列语音定位及增强;

刘加,教授,博士生导师,主要研究方向为语音识别、语音合成、语音编码、多媒体数字通信等。【责任编辑】侯莉

【收稿日期】2010-t}4-26

雌重煎篓垫!Q垒蔓塑堂蔓塑塑I严厂_

基于一阶差分传声器阵列频域LMS语音增强算法

作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:

王扇珍, 宋辉, 刘加, WANG Shanzhen, SONG Hui, LIU Jia

清华大学,电子工程系,清华信息科学与技术国家实验室(筹),北京,100084电声技术

AUDIO ENGINEERING2010,34(8)0次

参考文献(9条)

1. KAMATH S. LOIZOU P A multi-band spectral subtraction method for enhancing speech corrupted bycolored noise 2002

2. FLANAGAN J L Computer-steered microphone arrays for sound transduction in large rooms 19853. GRIFFITHS L J. JIM C W An alternative approach to linearly constrained adaptive beamforming 19824. ELKO G W. PONG A T N A simple adaptive first-order differential microphone 19955. 魏建强 基于小数量麦克风的语音增强算法研究 20056. 何振亚 自适应信号处理 2002

7. 崔玮玮. 曹志刚. 苏泳涛 基于FDM阵列技术的双通道语音增强方法 2008(7)

8. BOLL S F Suppression of acoustic noise in speech using spectral subtraction 19799. 职振华. 马建芬 改进的谱减法在语音增强中的应用 2008(2)

本文链接:http://d.wanfangdata.com.cn/Periodical_diansjs201008015.aspx

授权使用:大连理工大学图书馆(dllg),授权号:f725c1f6-3797-4d2f-9d35-9e7200ab8d95

下载时间:2011年1月21日

堕童堡查(v2

凹@6@@可@@嗡响⑨0⑨回U

文章编号:11102—8684{2010108--0053-04

基于一阶差分传声器阵列频域

LMS语音增强算法・

王扇珍,宋辉,刘加

(清华大学电子工程系,清华信息科学与技术国家实验室(筹),北京100084)

・论文・

【摘要】由于语音通信设备的广泛应用和小型化要求,消除其中的噪声干扰成为重点研究内容。采用了一种双通道的

语音增强算法。该方法基于一阶差分传声器阵列,并利用频域的最小均方误差自适应算法实现噪声消除。仿真结果表明。所采用的方法相对于时域自适应过程,加快了收敛速度,减小了计算量,并改善了噪声消除的效果,可更好地用于实际。【关键词】语音增强;一阶差分传声器阵列;频域LMS【中图分类号】TN912

First-orderDifferential

【文献标识码】A

Microphone

ArrayBased

on

FLMSAdaptiveSpeechEnhancementMethod

WANGShanzhen,SONGHui,LIUJia

(TsinghuaNationalLaboratoryforInformationScienceandTechnology,DepartmentofElectronicEngineering。

TsinghHa

University,Bering

widelyandbecome

00084,China)

【Almraet】As

become

on

communicationdevicesused

more

important.A

moreportable,theresearchofnoiseeliminationhasenhancementalgorithm

uses

moreand

dual-microphonespeech

is

proposed,which

isbased

the

FDM(First-orderDifferentialMicrophone)array,and

the

FLMS(1eastmeansquareadaptivealgorithm

in

frequency

domain)tocancelthenoise.Simulationsshowthatthismethodhasfasterconvergencespeedcompared

algorithmintime

call

with

theadaptivedomain,decreasestheamountofcalculation,andimprovestheperformanceof

inpracticalapplications

moresuitably.

noiseelimination.Soitbe

used

【Keywords】speech

enhancement;FDMarray;FLMS

前言

语音增强技术通过消除噪声干扰以提高语音通信

能达到较好的消噪效果[gl,因而无法满足设备小型化的

需要。而FDM技术在实现过程中仅需2个传声器,阵列结构简单,因而具有更广泛的应用领域,笔者的研究是针对双传声器的语音增强技术。

FDM阵列波束形成技术借鉴了声学方向性传声器的相关原理。利用不同的时延声音信号在传声器的振动膜两边振动产生压力差,也就是相当于两信号相减,而时延越大,压力差越大,输出信号就越强。

传统的自适应滤波器主要是在时域中实现。时域

最小均方误差(LeastMeanSquare,LMS)的优点是结

的质量,也可作为预处理来改善语音识别系统的稳健性。根据语音增强中所采用传声器数目的不同,可分为单通道语音增强和多通道语音增强IlI。谱减法[21及其改进方法M是普遍采用的单通道语音增强技术。然而,由于实际应用环境中信号复杂多变(方向性噪声、混响等),单通道语音增强系统已证明不再适用。于是便提出了传声器阵列语音增强方法,其方法包括了延迟和波束形成(Delay

and

Sum

Beamforming,DSB)[51、广义

旁瓣抵消(GeneralizedSidelobeCanceller,GSC)161、一

DifferentialMicrophone。

构简单,算法复杂度低,易于实现,稳定性高;缺点主要是收敛速度较慢,因而其应用也受到一定的限制。为了解决这些问题,常采用变换域LMS算法代替时域LMS

阶差分传声器FDM(First--order

FDM)阵列川。前两种方法通常需要大数量的传声器才

幸【基金项目】国家自然科学基金委员会与微软亚洲研究院联合资助项目60776800;国家自然科学基金委员会与香港研究资助局联合科研基金资助项目60931160443;国家高技术研究发展计划(863计划)项目(2006AA010101.2007AA042223,2008AA02

Z414,2008AA040201)

万方数据

皇枣熊羹婴堕蔓塑查蔓塑塑匡习

cr19(】)孚nat锆c

算法。变换域LMS算法的基本思想是:先对输入信号进行一次正交变换以去除或衰减其相关性,然后将变换后的信号加到自适应滤波器以实现滤波处理,从而改善相关矩阵的条件数。因为离散傅立叶变换本身具

有近似的正交性,加之有F盯快速算法,故频域LMS

(FLMS)算法被广泛应用。

2算法描述

2.1

FDM阵列语音增强

G.W.Elko和A.T.N.Pong在1995年提出FDM阵列技术171。它由2个或多个全向性传声器组成,基本工作原理与声学方向性传声器类似,通过前后2个传声器接收到的信号延迟差形成期望信号方向的心形波束,并在背对声源的方向形成零点。它最大的优点是结构小巧、实现简单。但为改变其波束零点就需要产生可变的时间差,这给实际的实现造成了困难。于是便产生了自适应波束形成技术,其框图如图l所示。

图中,Xl(n),X2(n)分别为2个传声器接收到的信

号,即

戈l(£)哥(t)*^l(f)抑l(£)(1)X2(f)=s(£)*^2(£)抑2(f)

(2)

式中,s(t)为期望语音信号,^;(£)(i=1,2)为声源到达每个传声器的脉冲响应,Xi(£)和Vi(£)(i=1,2)分别为各传声器接收到的带噪语音和噪声信号,在不考虑声学反射的条件下,式(1)一(2)可简化为

戈l(f)鄙(£)切l(f)

(3)髫1(f)=s(t吖)抑2(t)(4)

式中,r为声源信号到达的时间差。对远场信号,声音到达2个传声器的时间差为"r=(dcosO)/c。

在FDM模型中,Xf(f),魂(£)为t时刻经过一阶差分结构后的前向和后向心形波束所接收到的信号,即

xf(t)=x1(£)叫2(t-T)(5)氟(t)爿2(£)叫l(t-T)

(6)

在该系统中延迟r取固定的值的d/c,其中d为传声器间距,c为声速。经短时傅里叶变换可得自适应

万方数据

FDM阵列系统的传递函数

日仉啦2je-J,,一{sint宵,f-cd(1+cos0)]--/3sin【畦(1一

COSp)】}

(7:

可得其幅值

IH∽0)l=

sinf移罟(1+c。sp)】币si巾哮(1-c。s日)】I

(8:

波束的零点p枷可通过令式(7)为零得到,此时

‰…。s【斋…n‰删08l亩删扑‘蔚诅n芋’I

当阵列间距d和延时单元r都很小的情况下,茧(9)可近似为

‰一arcc。s钴1(101

通过自适应滤波使得该系统可自适应的调整心琵

零点的指向,从而自动跟踪空间中的噪声源,并消除啤

声。其波束方向如图2所示,通过改变届的值就可改委

波束零点指向。

270。

图2一阶背对背心形系统波束形成图

2.2

FLMS算法

频域LMS算法191是在自适应滤波之前先把输入作

号变换到频域,然后在频域上实现自适应滤波处理。硇

FLMS算法中,将输入信号戈(n)和期望信号d(n)分另分割成Ⅳ长(自适应滤波器的权数)的数据块,然后储Ⅳ点快速傅里叶变换(FFT),每个FFl’变换的输出签成Ⅳ个复数点X(k)和D(k),具有权系数矢量W(k

的输出

V(k)靠(_|})xW(后)

(11

式中,第k个数据块的频域权系数矢量w(k)和输入靠

号F丌系数的对角线矩阵X(后)分别定义为

W1(k)=【形。(||})形z(||})…形。(I|})】

国堕妻墼箜垫!Q生蔓丝鲞蔓塑塑

X忌、,

0“0

X/~蠡

、,f|

●●

;0

。舢;o

…XⅣ(J|})

频域自适应滤波器的计算误差

E(.|})=D(.j})-Y(k)

(12)

频域LMS自适应滤波器权系数的更新公式为

W(矗+1)=W(I|})懈(I|})占(J|})

(13)

式中,p为步长控制因子,将式(11)~(12)带入式(13)

中,得

W(k+1)=W(1j})堆畔(k)D(k)-X"(k)x(k)w(k)】

(14)

为保证算法收敛及算法的稳定性,p必须保证

0</z<亡

式中,A。为频域中输入信号的自相关矩阵巩中的最

大特征值。

权系数的更新每Ⅳ个样点进行一次,而每次的更新是,v个误差信号样点累加结果控制。这既保证了收敛速度,同时可利用快速FF-I.技术,用序列的循环卷积来计算线性卷积,从而大幅度减少运算量。3

仿真试验

通过计算机仿真试验验证算法的有效性。在仿真

试验中,传声器阵列由间距为d=4.25cm的2个全指向性传声器组成,语音信号的采样频率为8kHz,将期望声源(纯净语音信号)位于阵列的00方向。所用语音

声源为预先录制的3.75s长的信号。方向性干扰分别取NOISEX92的babble噪声和white噪声。

图3示出了所用的纯净语音信号、babble噪声和white噪声信号。

0j鹫

--o

采样点数/104

嚣。姻瓣辫瓣耨嘲渊鳓鹣测

1.o一一~—型璺始语音,——

O.5

1.0

1.5

2.O

2.5

3.O

采样点数,l04

墨。酗岬酬嗍礴枷㈣蚓嗍涮渺蝌娜哪嘲

.。

(b)white噪声

u・)厂————————————————————————————]

一O.5L—————————』——————————L—————————‘————.————J—————————J———————-'

0.51.01.52.02.53.0

采样点数,l04

(c)babble噪声

图3原始语音和噪声信号

万方数据

凹⑥6@@

试验中,分别将white噪声或babble噪声位于600,90。和1200,传声器阵列同时接收语音信号和噪声信号,在一定的信噪比下合成带噪语音信号。图4示出了当噪声源(white噪声或babble噪声)位于120。时,其中一个传声器所接收到的语音信号。

从图4可看出,此时传声器阵列所接收到的语音信号已属于噪声非常恶劣的情况。采用笔者提出的FDM阵列的频域LMS算法进行语音增强的试验仿真,图5-6分别示出了当white,babble噪声源位于600,900和1200时的语音增强结果。

迥馨

-o

采样点数门04

O5

O5

0.51.o1.52.o2.53.0

采样点数/l04

(c)1200

图5white噪声源位于不同方位时的语音增强结果

4试验结果分析及结论

噪声源分别位于不同方向便于分析算法对不同方

向噪声的抵消能力,而通过采用不同的噪声源可验证

笔者提出的算法对不同噪声的抑制能力。从仿真结果来看,即使在很恶劣的噪声环境下,针对不同噪声在不

塑撞煎型箜蔓翌堂蔓堂国

nn语音技术

W⑨6@@可⑧@晌响⑨0⑨⑨妙

嚣。卜_{—枷’—卜叫——-扣—★叫

1.0厂———————————————————]

-1’吁——菇——而——菇——云广—葛一。

采样点数/104

采霉产1数20004

(c)

图6babble噪声源位于不同方位时的语音增强结果

同方位时仍能取得很好的增强效果,从而验证了算法的有效性。

通过仿真可看出,在算法的开始阶段会有一段短暂的收敛过程,而相对于时域LMS算法来说,频域LMS算法在噪声消除过程中有更快的收敛速度。但由于在算法中对权系数的调整由Ⅳ个误差信号样点累加结果控制,每次的调整量很大,尤其在权向量的初始值为全0的情况下,若步长选取过大,就较易导致算法的发散,故要通过周围环境的噪声来决定所用的步长大小。在保证算法收敛的情况下,从语音增强的结果来看,取得了很好的噪声消除的效果。

在算法的计算复杂度方面,基于频域LMS的自适应算法先对输入信号进行频域变换,然后再用LMS算法实现在频域的自适应波束形成。相比于时域LMS,频域LMS算法增加了FFr的额外计算量。但频域变换都有快速算法,计算量不大。经过对算法分析,对于每Ⅳ点的输入序列,FLMS算法需要5个2N点的FFTr(包含WFT)计算和2个2N点的复数相乘。每个Ⅳ点FFTr

需要芸InN个复数乘法,对于实输入序列由于DFT的

对称特性,又可将运算量减半。对于时域的LMS算法,共需要2胪个实数乘法。每个复数乘法按4个实数乘法计算,则FLMS的运算量与LMS的运算量的比值可近似为(51nN+4)/N,这也从在仿真试验中运行不同的程序所需要时间上得到了证明。

笔者将FDM阵列技术与频域的自适应算法相结合,提出了一种双传声器语音增强算法。该算法能够通

过在频域里自适应调节波束形成的零点,从而达到消

除噪声的目的。通过试验仿真和算法分析证明,笔者算

万方数据

法在消除噪声的同时,计算量更小,收敛速度更快,因此也更容易实现小型化应用。

参考文献

【1】崔玮玮,曹志刚,苏泳涛.基于FDM阵列技术的双通道

语音增强算法叨.清华大学学报。2008,48(7):l135-1139.

[2】BOLL

SF.Suppressionofacousticnoiseinspeechusing

spectral

subtraction[J].IEEE

Trans.on

Acoustics,Speech

andSignalProcessing,1979,27:113-120.

【3】职振华,马建芬.改进的谱减法在语音增强中的应用们.

电声技术,2008,32(2):46-48.【4】KAMATH

S,LOIZOUP.Amulti-bandspectralsubtrac—

tion

methodforenhancingspeech

corrupted

by

colored

noise[C]//Proceedingsof

IEEEInternationalConference

on

Acoustics,Speech,andSignalProcessing.Orlando:IEEEPress,2002:675—678.

【5】5

FLANAGAN

JL.Computer-steeredmicrophonearraysfor

soundtranaductionin

large

rooms[J].Journal

ofAcoustic

SocietyofAmerica,1985,78:1508-1518.

【6】GRIFFITHS

LJ,JIMCW.Analternativeapproach

tolin—

earlyconstrainedadaptivebeamforming[J].IEEETram.on

AntennasPropagation,1982,30:27-34.

【7】ELKO

W,PONGATN.Asimpleadaptivefirst-order

differentialmicrophone【c]//Proceedings

ofIEEE

ASSPworkshop

on

Applicationsof

Signal

Processing

to

Audio

andAcoustics.NewPaltz:IEEEPress,1995:169-172.

【8】魏建强.基于小数量麦克风的语音增强算法研究【D】.北

京:中国科学院声学研究所,2005.【9】9

何振哑.自适应信号处理fM】.北京:科学出版社,2002.

作者简介

王扇珍,硕士研究生,主要研究方向为传声器阵列语音增强算法研究;

宋辉,博士研究生,主要研究方向为传声器阵列语音定位及增强;

刘加,教授,博士生导师,主要研究方向为语音识别、语音合成、语音编码、多媒体数字通信等。【责任编辑】侯莉

【收稿日期】2010-t}4-26

雌重煎篓垫!Q垒蔓塑堂蔓塑塑I严厂_

基于一阶差分传声器阵列频域LMS语音增强算法

作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:

王扇珍, 宋辉, 刘加, WANG Shanzhen, SONG Hui, LIU Jia

清华大学,电子工程系,清华信息科学与技术国家实验室(筹),北京,100084电声技术

AUDIO ENGINEERING2010,34(8)0次

参考文献(9条)

1. KAMATH S. LOIZOU P A multi-band spectral subtraction method for enhancing speech corrupted bycolored noise 2002

2. FLANAGAN J L Computer-steered microphone arrays for sound transduction in large rooms 19853. GRIFFITHS L J. JIM C W An alternative approach to linearly constrained adaptive beamforming 19824. ELKO G W. PONG A T N A simple adaptive first-order differential microphone 19955. 魏建强 基于小数量麦克风的语音增强算法研究 20056. 何振亚 自适应信号处理 2002

7. 崔玮玮. 曹志刚. 苏泳涛 基于FDM阵列技术的双通道语音增强方法 2008(7)

8. BOLL S F Suppression of acoustic noise in speech using spectral subtraction 19799. 职振华. 马建芬 改进的谱减法在语音增强中的应用 2008(2)

本文链接:http://d.wanfangdata.com.cn/Periodical_diansjs201008015.aspx

授权使用:大连理工大学图书馆(dllg),授权号:f725c1f6-3797-4d2f-9d35-9e7200ab8d95

下载时间:2011年1月21日


相关文章

  • 基于麦克风阵列的语音增强方法
  • 基于麦克风阵列的语音增强方法 概述:在日常生活和工作中,语音通信是人与人之间互相传递信息沟通不可缺少的方式.在语音通信中,语音信号不可避免地会受到来自周围环境和传输媒介的外部噪声.通信设备的内部噪声及其他讲话者的干扰.这些干扰共同作用,最终 ...查看


  • 基于FPGA自适应有源降噪耳机系统的设计_李欣
  • oise 噪声控制 Control 文章编号:1002-8684(2008)04-0072-04 基于FPGA自适应有源降噪耳机系统的设计・实用设计・ 李 欣,冯 燕,冯 勇 (西北工业大学电子信息学院,陕西西安710072) 摘[ 要]介 ...查看


  • 江苏省大学生创新训练计划项目研究总结报告
  • 附件3 江苏省大学生创新训练计划项目研究总结报告 一.项目研究背景及意义 20世纪集成电路的发展为数字音频技术提供了良好的发展空间,使数字音频技术得到了迅猛的发展.随着音频处理技术的发展,它们对音质.体积.功耗和处理速度的要求越来越苛刻,作 ...查看


  • 基于麦克风阵列的实时声源定位
  • 第27卷第6期 2010年6月 计算机应用与软件 Co m puter App lications and So ft w are Vo l 127No . 6Jun . 2010 基于麦克风阵列的实时声源定位 刘真旭 (上海交通大学计算机 ...查看


  • 4G系统中多天线技术
  • 4G 系统中多天线技术 由于第三代移动通信系统(3G )还存在一些不足,包括很难达到较高的通信速率,提供服务速率的动态范围不大,不能满足各种业务类型要求,以及分配给3G 系统的频率资源已经趋于饱和等,于是人们提出了第四代移动通信系统(4G ...查看


  • 201303基于STM32的嵌入式语音识别设备
  • 基于STM32的嵌入式语音识别设备 王 (南京航空航天大学 [摘 冲,施玉霞 南京210016) 自动化学院,江苏 ·系统介绍· 要]使用STM32F103ZET6处理器及LCD构建了一个嵌入式语音识别设备,使用片内12bitADC实现16 ...查看


  • 基于机器人听觉的声源定位策略
  • 基于机器人听觉的声源定位策略 吕晓玲 张明路 河北工业大学 机械工程学院, 天津300130 摘要:针对机器人听觉定位,提出了五个传声器阵列作为机器人的耳朵,其中四个传声器组成的平面阵确定声源空间位置,另外一个传声器辅助实现声源位于机器人前 ...查看


  • 语音识别的痛点在哪,从交互到精准识别如何做?
  • 语音识别是目前应用最成熟的人机交互方式,从最初大家体验过的有屏手持设备这种近场的语音识别,如Siri以及各种语音助手,到现在,语音识别的应用已经完成了向智能硬件以及机器人上延伸,不过,新的人机交互对硬件.算法要求更加苛刻,各企业正面临着巨大 ...查看


  • 基于麦克风阵列的近场声源定位
  • 2008年4月四川大学学报(自然科学版) Apr.2008 第45卷第2期 Journalof SichuanUniversity(NaturalScienceEdition) v01.45No.2 文章编号:0490-6756(2008) ...查看


热门内容