第18卷第3期
电子设计工程
2010年3月
V01.18
No.3
ElectronicDesignEngineering
Mar.2010
混合激励线性预测低速率语音编码研究
贾亮,赵鹏飞.危国腾
(沈阳航空工业学院电子与信息工程学院。辽宁沈阳110136)
摘要:为了满足数字通信及其他商业应用的需求.语音压缩编码技术得到迅速发展。近年来主流的低速率语音缡码方案主要基于U,c一10,混合激励线性预测(MELP),多带激励缟码(MBE),正弦变换缡码(SCI),波形内插编码(WI),大多都工作在2.4klgs速率下。作为一种重要的低速率语音缡码算法.MELP算法对U,c—lO编码方案进行大量改进,引入混合激励,非周期脉冲。残差付氏幅度谱,脉冲散布和自适应谱滤波5个特征。实验结果表明,该混合激励线性预测编码在2.4kb/s上得到了更好的合成语音.并使得合成语音能更好地拟舍自然语音。关键词:混合激励线性预潮(MELP);语音鳊码;混合激励;脉冲散布中圈分类号:TN912.3
文献标识码:A
文章编号:1674-6236(20lO)03埘25—04
Researchof
MELP
lowbitratemgitalspeechcoding
JIALiang,ZHAOPeng-fei,WEIGuo-teng
(SchoolofElectronicandInformation
Engineering,ShenyangInstituteofAeronauticalE堙妇er打垮,Shenyang
1
10136,China)
Abstract:In
order
to
satis匆demandsofthe
digitalcommunicationandothercommercialapplications,thespeechcompres-
siontechnologyhasbeendevelopedrapidly.Therea∞severalmainLBRSCprevailingin
recent
years.such
a8
linepredic・
Oon
coding(Ll屯-10),mixedexcitationlineprediction(MELP),multi-bandexcitation(MBE),sinuseidaltransformcording
(STC)。andwaveforminterpolation(W1),mostofwhichworks
at
the
mteof2.4kb/s.MELPalgorithmisbased
on
thebasis
ofLine
Prediction(LP).FivecharactershasbeenintroducedintoMELPalgorithm,tIleya糟mixedexcitation,aperiodic
pulse.Fouriermagnitudespulsedispersionandadaptivespectralfiltering.Theexperimentalresultsshowthatthemixed
ex-
citationlinearpredictivecodinginthe2.4kb/s
giw
a
better
synthesizedspeech,andmakesthesynthesizedspeech
to
better
fittlle
natural
voice.
Key
words:mixed-excitationlinearpredictive(MELP);speechcoding;mixedexcitation;pulsedispersal
近年来,随着人们对通信需求的不断增加。在各种通信声码器采用周期脉冲串或白噪声作为全极点合成滤波器的系统中。信道资源愈来愈宝贵。对于主要通信业务之一的语激励.为了改善LPC声码器的音质,MELP编码技术把语音音通信,利用尽量少的资源来传输语音的需求更为迫切。特分为清音、浊音和抖动浊音3种状态。
别是在军事通信中。2.4_4.8kb/s速率的语音编码的需求尤为迫切。因此需压缩语音信号的传输带宽或降低电话信道的传陬硐——一
输码率,语音编码在其中十分重要。
直基音初估
流糊
l滤
2.4
kb/s混合激励线性预测MELP(mixed-excitation
linear
滤斟卜
波
predictive)低比特率数字语音编码技术t’I是在基本线性预测
通_1标志位l
岖驷
’uL也
编码LPC(1inearpredictiveceding)的基础上结合混合激励、多
带带激励以及原型波形内插等编码方法的优点。采用一种更符分析
合人类发音机制的语音生成模型来合成语音。并利用自适应豢要
1增I。一蕊卜匦
频谱增强技术。提高合成语音与原始语音的匹配度,从而实计蟮
现低码率、高质量的合成语音。l
MELP语音编码技术的基本原理
图l四表示数字化后的信号通过一个4阶切比雪夫高通
滤波器.滤除50Hz直流工频干扰,MELP编码采用多带混合激励进行清浊音判决,以提取准确的基音信号。传统的U.c坠一
纂图l
MELP编码器原理
收稿日期:2009.09—07
稿件编号:200909023
作者简介:贾壳(197l一),男,辽宁大石桥人,剐教授。研究方向:信号与信息处理。
一25一
万
方数据
《电子设计工程))2070年第3期
线性预测主要分为输入语音信号的分析和残差信号的分析2部分。若浊音段信号的周期性不是很好时.通过非周期性标志在解码端采用与之相适应的激励源激励不稳定的声带脉冲。
MELP按照感知加权失真度最小的逼近准则.采用4级码本的快速搜索矢量量化算法,大大缩短码本搜索时间。经误码检测的比特流打包后,通过通信系统发送,锯码器在接收端重构输入信号.尽管MELP编码不能完整的恢复出原始信号,但从计算机模拟仿真结果可看出.MELP在较低的比特率上.产生了高质量的重构语音信号。MELP编码中的关键技术
采用多带混合激励是MELP模型最霞要的特征,传统LPC编码算法在每一帧中仪对输入信号进行一次清浊音判决。在解码端也简单用一个清浊音开关表示。不能完整表达kb/s的MELP算法中。将0~4kHz的语kHz,0.5~1kHz,1—2kHz,2—3kHz,3-4kHz
5
分带滤波器由5个6阶的巴特沃思带通滤波器相加得到,滤波后的语音信号经全波整流及平滑滤波.再进行清浊采用混合激励可以减少合成语音中的蜂呜噪声。但若需在编码端用非周期标志来标识周期性不是很强的浊音人说话时声道的共振峰带宽即使在一个基音周期内也
自适应谱增强技术141通过让激励信号经过自适应谱增强
-26-
万
方数据滤波器而实现。f-I适应谱增强滤波器由系数自适应变化的、阶数等于线性预测阶数的零极点滤波器与一阶全极点滤波器级联而成的滤波器组组合而成。通过突出激励谱中共振峰频率处的谱幅度,可以提高整个短时谱在共振峰处的信噪
l箍倒。㈣@一
囱囱制||俐驴2
2.1多带混合激励
语音信号所含的丰富激励信息。多带的思想来源于MBE算法。采用多带处理在频域更精细的划分激励信号.所合成的激励也更准确。在2.4音信号在0~0.5
个频段分别进行清浊音判决处理。
音判决,从而得到对应频带的基音。采用多带混合激励重构原始信号时.采用一个随频率变化的清浊音判决器取代简单的清浊音开关,用混合激励取代简单的二元激励,从而得到一个与短时谱相对应的、具有清音和浊音混合成分的激励谱,大大提高了合成语音的质量。2.2使用非周期脉冲
处理的信号基音较高同时义伴有噪声时.通常在激励信号中混入较多的低频白噪声以减弱其周期性.但这样会给合成语音引入杂音.在MELP算法巾使用一种更有效的处理办法一非周期脉冲131。
段,这样接收端解码时根据非周期性标志让基音周期在一个区问随机变动.以减弱合成语音的周期性。采用该方法可较好地模拟那些不稳定的声门脉冲,使合成语音激励更加逼近原始语音激励。
2.3自适应谱增强技术
可能发牛变化。并且I戌这种全极点模型削弱共振峰的特
征,这使得LPC合成滤波器的极点形状与自然语音的共振峰形状之间存在一定偏差,导致在共振峰之间合成语音谱的波谷不如原始语音谱的波谷尖锐。使合成语音在人耳听来感觉
有点发闷。
贾亮。等混合激励线性预测低速率语音编码研究
模式;若为n--2,则说明发生2bit的错误,无法纠正,使用帧丢弃,用上一帧的参数取代它;若n>2,解码出对数基音值,经反对数变换还原成原来的基音值,使用浊音模式。在清音模式下,对(8,4)汉明码解码,纠正单个比特的错误和检测双比特错误。若检测到一个不可纠正的错误,则给出一个帧丢弃指示。否则。解码出(7,4)汉明码并纠正该单个错误。合成的语音模式有以下3种:
1)帧删除模式
当解码时检测到不可纠正的错误时使
用该模式,用前一帧的参数代替当前帧的参数,并使Gl_G2,不改变增益。
2)清音模式
在清音模式下将对基音、基音抖动、带通
浊音强度和残差谱的傅里叶级数等激励参数都使用缺省参数值。基音值被设为50个取样,基音抖动值设为25%。所有的带通浊音强度都设为0,残差谱的系数全置为1。I_SF和增益参数则给予正常的解码。
3)浊音模式此时Vk.为1,若非周期标志为l,则基音抖动为25%,否则为0。若y晡为1。则其对应的带通浊音强度为l,否则为O。若yw(f-2,3,4,5)为0001,则y够设为0。
对于LSF.首先通过对应的码字找到每一级最佳码本矢量。然后对这4级最佳码本求和。求得的矢量和就是解码出的LSF参数。解码出残差谱的傅里叶级数尺K),(尺=l,2,…,10)为其码字所对应的最佳码矢量。对于增益,需解码C,和G:,应先解主增益C2,再解GI。
3.2噪声抑制
MELP算法采用能量相减方法去噪.通过统计值控制总的合成增益衰减,该方法认为噪声平均分配在所有频段。使用自适应噪声谱相减法抑制噪声。实际应用时通过对解码后的增益参量进行小的增益衰减来实现。衰减对2个增益进行,对G。衰减前需先更新背景噪声估计值皖,若Gl>C。+G。,则GI=G。+G。;若Gl<C。一Gd。,贝0Gl=G。一Gd。。,否贝0
Gl=G。,
G。v--O.337435,Gb.--O.135
418,对于每秒88.9次的增益修正
率,噪声估计值最大每秒上升3dB,或每秒下降12dB,估计值在10~80之间。通过扣除修正项G。调整增益G。,G。表达式
如下:
G。=-lOlg[1-10a。‘甜均’】
(3)
式中,G。最大值为6dB,G。上限为20dB。
3.3参数插值
’
MELP对增益、ISF、基音周期、基音抖动、残差谱傅里叶级数、混合激励脉冲和噪声比例、自适应谱增强滤波器的频谱倾斜系数都进行插值。若新的基音周期起点t。(0,l,…,179)的值小于90,则增益在前一帧的第2个增益G知和G,当前帧的第1个增益G。之间线性插值;否则增益在本帧G。和G:之间插值。其他参数在前一帧的值和当前帧的值之间线性插值。插值因子int根据新的基音周期的起点决定。
int=to/180
(4)
若G.比C知大6dB,且当前帧的基音值不到前一帧基音值的一半时,则认为是过渡帧,这时直接使用新的基音值而
万
方数据无需插值。若C:与G知相差6dB以上,表明前后两帧参数差异较大,这时用增益计算插值因子,此时插值因子int为:
int=镑
(5)
3.4混合激励旧MELP激励是分带滤波后的脉冲和噪声激励之和。脉冲激
励ep(n)(n=O,l,…,弘1)用长度为一个基音周期的离散傅里
叶反变换计算得到:
郎(n)=专∑M(k)exp(j21rnk/T)
(6)
式中.r等于插值后的基音值加上基音抖动强度与基音之积所得的和,M(k)由插值后的残差谱的傅里叶级数F(k)(k=l,2,…,10)生成。一般认为脉冲激励相位为0,因此M(k)是实数,因e。(,1)为实数,M(k)满足:
M(7Ll|})=肘(后)。
(蠡=l,2,…,£)(7)
若7’为偶数,则£=耽;否则L=(T-I)/2。直流项肘(0)被
置为0,系数项肘(||})表达式如下:
肘c矗,=(:’:竺iI;后=1’2,…'1。’
c8,
为了防止均匀周期开始的剧变,所生成的脉冲激励要循环移位延迟10个取样.以使主激励脉冲位于基音周期的第lO个取样点的位置上。然后用脉冲激励信号乘以基音周期的平方根,保持信号RMS的一致。对得到的脉冲激励进行电平调整。将其乘以l000.保证与一般信号的幅度相一致。噪声用同余法产生均匀分布白噪声,其RMS值为1000。随机范围在±1732之间。经电平调整和限幅后的信号作为噪声源。当前帧的脉冲合成滤波器由浊音频带的带通滤波器系数之和给出。噪声合成滤波器由清音频带的带通滤波器系数之和给出。脉冲和噪声源各自滤波后相加合成混合激励。合成滤波器的作用相当于依据各子带清/浊音判决对子带激励信号从频域加权求和。3.5语音合成
混合激励信号合成后经过自适应谱增强滤波器进行处理,滤波器是一个10阶零,极点滤波器与1个一阶零点滤波
器的级联。其系数由内插后的LSP系数构成的线性预测滤波器AQ)得到,其传输函数为嗍:
也(咖象貉(1舭-1),(a---O.5P'3--0.8p)
(9)
倾斜系数肛首先取max(O.5k,,0),然后进行内插,最后乘以信号相似参数P,其中k.是由解码后的LSP系数变换得到的第1个反射系数,P根据当前内插后的增益G.n与背景噪声的估计值C。得到。
p=铲
(10)
式中。O<p<l。
激励信号进行LPC合成得到合成语音。Ll,C合成使用一个直接形式的滤波器,其系数由插值后的I.SF参数得到。LP合成滤波器的传输函数为吼
-27-
《电子设计工程}20lo年第3期
取0—140000个采样点观察比较。从结果中可看出,MELP编码算法在较低的编码比特率时能较好的重构原始语音信号.从听音测试的结果来看。采用MELP编码的合成语音也能够
式中,童由量化的、内插的LSF参数得到。
合成语音再经以下增益因子调整:
(12)
很好的满足现今通信系统对语音质量的要求。
4.3
MELP与几种不同语音编码算法性能比较嗍以音韵字可懂度测量DRT(diagnostic
fIlyme
test)、满意
度测量DAM(diagnostic
acceptability
test)、平均主观打分
MOS(meanopinionscore)作为性能指标比较几种语音编码算
为保证合成语音连贯性。在一个基音周期内的前10个样点的增益因子是当前帧的因子与前一帧的校正因子的线性内插值。合成语音经脉冲离散滤波器输出。4
4.1
法的性能.如表2所示。
表2几种不同语音编码算法性能比较
MELP编码性能分析及仿真结果
M[ELP声码器参数的比特分配表
MELP编码对原始的语音信号采用8kHz抽样,帧长为
22.5
从表2中可以看出.MELP编码在低速率上获得高质量的合成语音,并且满足通信系统的要求。其编码质量甚至可与4.8kb/s的CELP编码相媲美。
ms,每帧1440比特的语音信号经MELP编码后,输出
仅54个比特数据流。编码过程中各参数所占用的比特分配如表1所示。
表1
MELP声码器比特分配表
5结束语
MELP语音压缩编码算法是在基本的LPC模型上。吸收多带的思想,采用混合激励的形式,因此它兼有LPE和多带激励的优点。MELP的低编码比特率及高语音合成质量必将在未来的无线通信领域发挥重要作用。参考文献:【1】McCree
AV,Barnwell
mT
P.AmixedexcitationLPC
VOCA3-
dermodelforlowbittions
OR
rate
speech
coding[1].IEEE
Transaca-
SpeechandAudio
Processing,1995,3(4):242—250.
【2】张雄伟,陈亮,杨吉斌.现代语音处理技术及应用【M】.北京:机械工业出版社.2003.
4.2合成语音与原始语音信号比较
图3是经过MA7FLAB软件仿真后得到的合成语音信号和原始语音信号的波形与频谱比较图,仿真所用的采样频率为8kHz,每个采样点用8bit比特进行量化。为便于观察,选
【3】王洪,唐凯.低速率语音编码【M】.北京:国防工业出版社,
2006.
【4】鲍长春.数字语音编码原理【M】.西安:西安电子科技大学出
版社.2007.【5】AlanV
McCree,KwanTruong。BryanGeorgeE,etaLA2.4Kbitps
new
MELPcodercandidatefort11e
U.S.Federal[J].Proceeding
of
ICASSP。1998(5):1们k112
【6l钟明.一种2.4Kbps改进型MBELP编码[J]Joumal
tronics.2000(5):122一124.
ofElec-
f7】7
GriffinD
W,LimJS.Multibandexciationvocoder[J].IEEE-
TransonASSP,1998,36(8):1223—1235.
【8】吴家安.现代语音缡码技术【M】.北京:科学出版社,2008.【9】刘宽海,葛万成.MELP低比特率数字语音编码技术研究
【J】.InformationTechnology,2003,27(8):52—54.
(c)原始信号频谱
(d)合成语音频谱
【101潘军,丁晓明.低速率语音编码技术与应用叨.电声技术,
图3
MELP原始语音与合成语音比较
200l。188(2):33-36.
-28-
万方数据
混合激励线性预测低速率语音编码研究
作者:作者单位:刊名:英文刊名:年,卷(期):
贾亮, 赵鹏飞, 危国腾, JIA Liang, ZHAO Peng-fei, WEI Guo-teng沈阳航空工业学院,电子与信息工程学院,辽宁,沈阳110136电子设计工程
ELECTRONIC DESIGN ENGINEERING2010,18(3)
参考文献(10条)
1. 刘宽海;葛万成 MELP低比特率数字语音编码技术研究[期刊论文]-Information Technology 2003(08)2. 吴家安 现代语音编码技术 2008
3. Griffin D W;Lim J S Multiband exciation vocoder 1998(08)
4. 钟明 一种2.4 Kbps改进型MBELP编码[期刊论文]-Joumal of Electronics 2000(05)
5. AlanV McCree;KwanTruong;Bryan George E A 2.4Kbitps MELP coder candidate for the new U.S.Federal1998(05)
6. 鲍长春 数字语音编码原理 20077. 王洪;唐凯 低速率语音编码 2006
8. 张雄伟;陈亮;杨吉斌 现代语音处理技术及应用 2003
9. 潘军;丁晓明 低速率语音编码技术与应用[期刊论文]-电声技术 2001(02)
10. McCree A V;Barnwell III T P A mixed excitation LPC voco-der model for low bit rate speech coding1995(04)
本文链接:http://d.g.wanfangdata.com.cn/Periodical_dzsjgc201003010.aspx
第18卷第3期
电子设计工程
2010年3月
V01.18
No.3
ElectronicDesignEngineering
Mar.2010
混合激励线性预测低速率语音编码研究
贾亮,赵鹏飞.危国腾
(沈阳航空工业学院电子与信息工程学院。辽宁沈阳110136)
摘要:为了满足数字通信及其他商业应用的需求.语音压缩编码技术得到迅速发展。近年来主流的低速率语音缡码方案主要基于U,c一10,混合激励线性预测(MELP),多带激励缟码(MBE),正弦变换缡码(SCI),波形内插编码(WI),大多都工作在2.4klgs速率下。作为一种重要的低速率语音缡码算法.MELP算法对U,c—lO编码方案进行大量改进,引入混合激励,非周期脉冲。残差付氏幅度谱,脉冲散布和自适应谱滤波5个特征。实验结果表明,该混合激励线性预测编码在2.4kb/s上得到了更好的合成语音.并使得合成语音能更好地拟舍自然语音。关键词:混合激励线性预潮(MELP);语音鳊码;混合激励;脉冲散布中圈分类号:TN912.3
文献标识码:A
文章编号:1674-6236(20lO)03埘25—04
Researchof
MELP
lowbitratemgitalspeechcoding
JIALiang,ZHAOPeng-fei,WEIGuo-teng
(SchoolofElectronicandInformation
Engineering,ShenyangInstituteofAeronauticalE堙妇er打垮,Shenyang
1
10136,China)
Abstract:In
order
to
satis匆demandsofthe
digitalcommunicationandothercommercialapplications,thespeechcompres-
siontechnologyhasbeendevelopedrapidly.Therea∞severalmainLBRSCprevailingin
recent
years.such
a8
linepredic・
Oon
coding(Ll屯-10),mixedexcitationlineprediction(MELP),multi-bandexcitation(MBE),sinuseidaltransformcording
(STC)。andwaveforminterpolation(W1),mostofwhichworks
at
the
mteof2.4kb/s.MELPalgorithmisbased
on
thebasis
ofLine
Prediction(LP).FivecharactershasbeenintroducedintoMELPalgorithm,tIleya糟mixedexcitation,aperiodic
pulse.Fouriermagnitudespulsedispersionandadaptivespectralfiltering.Theexperimentalresultsshowthatthemixed
ex-
citationlinearpredictivecodinginthe2.4kb/s
giw
a
better
synthesizedspeech,andmakesthesynthesizedspeech
to
better
fittlle
natural
voice.
Key
words:mixed-excitationlinearpredictive(MELP);speechcoding;mixedexcitation;pulsedispersal
近年来,随着人们对通信需求的不断增加。在各种通信声码器采用周期脉冲串或白噪声作为全极点合成滤波器的系统中。信道资源愈来愈宝贵。对于主要通信业务之一的语激励.为了改善LPC声码器的音质,MELP编码技术把语音音通信,利用尽量少的资源来传输语音的需求更为迫切。特分为清音、浊音和抖动浊音3种状态。
别是在军事通信中。2.4_4.8kb/s速率的语音编码的需求尤为迫切。因此需压缩语音信号的传输带宽或降低电话信道的传陬硐——一
输码率,语音编码在其中十分重要。
直基音初估
流糊
l滤
2.4
kb/s混合激励线性预测MELP(mixed-excitation
linear
滤斟卜
波
predictive)低比特率数字语音编码技术t’I是在基本线性预测
通_1标志位l
岖驷
’uL也
编码LPC(1inearpredictiveceding)的基础上结合混合激励、多
带带激励以及原型波形内插等编码方法的优点。采用一种更符分析
合人类发音机制的语音生成模型来合成语音。并利用自适应豢要
1增I。一蕊卜匦
频谱增强技术。提高合成语音与原始语音的匹配度,从而实计蟮
现低码率、高质量的合成语音。l
MELP语音编码技术的基本原理
图l四表示数字化后的信号通过一个4阶切比雪夫高通
滤波器.滤除50Hz直流工频干扰,MELP编码采用多带混合激励进行清浊音判决,以提取准确的基音信号。传统的U.c坠一
纂图l
MELP编码器原理
收稿日期:2009.09—07
稿件编号:200909023
作者简介:贾壳(197l一),男,辽宁大石桥人,剐教授。研究方向:信号与信息处理。
一25一
万
方数据
《电子设计工程))2070年第3期
线性预测主要分为输入语音信号的分析和残差信号的分析2部分。若浊音段信号的周期性不是很好时.通过非周期性标志在解码端采用与之相适应的激励源激励不稳定的声带脉冲。
MELP按照感知加权失真度最小的逼近准则.采用4级码本的快速搜索矢量量化算法,大大缩短码本搜索时间。经误码检测的比特流打包后,通过通信系统发送,锯码器在接收端重构输入信号.尽管MELP编码不能完整的恢复出原始信号,但从计算机模拟仿真结果可看出.MELP在较低的比特率上.产生了高质量的重构语音信号。MELP编码中的关键技术
采用多带混合激励是MELP模型最霞要的特征,传统LPC编码算法在每一帧中仪对输入信号进行一次清浊音判决。在解码端也简单用一个清浊音开关表示。不能完整表达kb/s的MELP算法中。将0~4kHz的语kHz,0.5~1kHz,1—2kHz,2—3kHz,3-4kHz
5
分带滤波器由5个6阶的巴特沃思带通滤波器相加得到,滤波后的语音信号经全波整流及平滑滤波.再进行清浊采用混合激励可以减少合成语音中的蜂呜噪声。但若需在编码端用非周期标志来标识周期性不是很强的浊音人说话时声道的共振峰带宽即使在一个基音周期内也
自适应谱增强技术141通过让激励信号经过自适应谱增强
-26-
万
方数据滤波器而实现。f-I适应谱增强滤波器由系数自适应变化的、阶数等于线性预测阶数的零极点滤波器与一阶全极点滤波器级联而成的滤波器组组合而成。通过突出激励谱中共振峰频率处的谱幅度,可以提高整个短时谱在共振峰处的信噪
l箍倒。㈣@一
囱囱制||俐驴2
2.1多带混合激励
语音信号所含的丰富激励信息。多带的思想来源于MBE算法。采用多带处理在频域更精细的划分激励信号.所合成的激励也更准确。在2.4音信号在0~0.5
个频段分别进行清浊音判决处理。
音判决,从而得到对应频带的基音。采用多带混合激励重构原始信号时.采用一个随频率变化的清浊音判决器取代简单的清浊音开关,用混合激励取代简单的二元激励,从而得到一个与短时谱相对应的、具有清音和浊音混合成分的激励谱,大大提高了合成语音的质量。2.2使用非周期脉冲
处理的信号基音较高同时义伴有噪声时.通常在激励信号中混入较多的低频白噪声以减弱其周期性.但这样会给合成语音引入杂音.在MELP算法巾使用一种更有效的处理办法一非周期脉冲131。
段,这样接收端解码时根据非周期性标志让基音周期在一个区问随机变动.以减弱合成语音的周期性。采用该方法可较好地模拟那些不稳定的声门脉冲,使合成语音激励更加逼近原始语音激励。
2.3自适应谱增强技术
可能发牛变化。并且I戌这种全极点模型削弱共振峰的特
征,这使得LPC合成滤波器的极点形状与自然语音的共振峰形状之间存在一定偏差,导致在共振峰之间合成语音谱的波谷不如原始语音谱的波谷尖锐。使合成语音在人耳听来感觉
有点发闷。
贾亮。等混合激励线性预测低速率语音编码研究
模式;若为n--2,则说明发生2bit的错误,无法纠正,使用帧丢弃,用上一帧的参数取代它;若n>2,解码出对数基音值,经反对数变换还原成原来的基音值,使用浊音模式。在清音模式下,对(8,4)汉明码解码,纠正单个比特的错误和检测双比特错误。若检测到一个不可纠正的错误,则给出一个帧丢弃指示。否则。解码出(7,4)汉明码并纠正该单个错误。合成的语音模式有以下3种:
1)帧删除模式
当解码时检测到不可纠正的错误时使
用该模式,用前一帧的参数代替当前帧的参数,并使Gl_G2,不改变增益。
2)清音模式
在清音模式下将对基音、基音抖动、带通
浊音强度和残差谱的傅里叶级数等激励参数都使用缺省参数值。基音值被设为50个取样,基音抖动值设为25%。所有的带通浊音强度都设为0,残差谱的系数全置为1。I_SF和增益参数则给予正常的解码。
3)浊音模式此时Vk.为1,若非周期标志为l,则基音抖动为25%,否则为0。若y晡为1。则其对应的带通浊音强度为l,否则为O。若yw(f-2,3,4,5)为0001,则y够设为0。
对于LSF.首先通过对应的码字找到每一级最佳码本矢量。然后对这4级最佳码本求和。求得的矢量和就是解码出的LSF参数。解码出残差谱的傅里叶级数尺K),(尺=l,2,…,10)为其码字所对应的最佳码矢量。对于增益,需解码C,和G:,应先解主增益C2,再解GI。
3.2噪声抑制
MELP算法采用能量相减方法去噪.通过统计值控制总的合成增益衰减,该方法认为噪声平均分配在所有频段。使用自适应噪声谱相减法抑制噪声。实际应用时通过对解码后的增益参量进行小的增益衰减来实现。衰减对2个增益进行,对G。衰减前需先更新背景噪声估计值皖,若Gl>C。+G。,则GI=G。+G。;若Gl<C。一Gd。,贝0Gl=G。一Gd。。,否贝0
Gl=G。,
G。v--O.337435,Gb.--O.135
418,对于每秒88.9次的增益修正
率,噪声估计值最大每秒上升3dB,或每秒下降12dB,估计值在10~80之间。通过扣除修正项G。调整增益G。,G。表达式
如下:
G。=-lOlg[1-10a。‘甜均’】
(3)
式中,G。最大值为6dB,G。上限为20dB。
3.3参数插值
’
MELP对增益、ISF、基音周期、基音抖动、残差谱傅里叶级数、混合激励脉冲和噪声比例、自适应谱增强滤波器的频谱倾斜系数都进行插值。若新的基音周期起点t。(0,l,…,179)的值小于90,则增益在前一帧的第2个增益G知和G,当前帧的第1个增益G。之间线性插值;否则增益在本帧G。和G:之间插值。其他参数在前一帧的值和当前帧的值之间线性插值。插值因子int根据新的基音周期的起点决定。
int=to/180
(4)
若G.比C知大6dB,且当前帧的基音值不到前一帧基音值的一半时,则认为是过渡帧,这时直接使用新的基音值而
万
方数据无需插值。若C:与G知相差6dB以上,表明前后两帧参数差异较大,这时用增益计算插值因子,此时插值因子int为:
int=镑
(5)
3.4混合激励旧MELP激励是分带滤波后的脉冲和噪声激励之和。脉冲激
励ep(n)(n=O,l,…,弘1)用长度为一个基音周期的离散傅里
叶反变换计算得到:
郎(n)=专∑M(k)exp(j21rnk/T)
(6)
式中.r等于插值后的基音值加上基音抖动强度与基音之积所得的和,M(k)由插值后的残差谱的傅里叶级数F(k)(k=l,2,…,10)生成。一般认为脉冲激励相位为0,因此M(k)是实数,因e。(,1)为实数,M(k)满足:
M(7Ll|})=肘(后)。
(蠡=l,2,…,£)(7)
若7’为偶数,则£=耽;否则L=(T-I)/2。直流项肘(0)被
置为0,系数项肘(||})表达式如下:
肘c矗,=(:’:竺iI;后=1’2,…'1。’
c8,
为了防止均匀周期开始的剧变,所生成的脉冲激励要循环移位延迟10个取样.以使主激励脉冲位于基音周期的第lO个取样点的位置上。然后用脉冲激励信号乘以基音周期的平方根,保持信号RMS的一致。对得到的脉冲激励进行电平调整。将其乘以l000.保证与一般信号的幅度相一致。噪声用同余法产生均匀分布白噪声,其RMS值为1000。随机范围在±1732之间。经电平调整和限幅后的信号作为噪声源。当前帧的脉冲合成滤波器由浊音频带的带通滤波器系数之和给出。噪声合成滤波器由清音频带的带通滤波器系数之和给出。脉冲和噪声源各自滤波后相加合成混合激励。合成滤波器的作用相当于依据各子带清/浊音判决对子带激励信号从频域加权求和。3.5语音合成
混合激励信号合成后经过自适应谱增强滤波器进行处理,滤波器是一个10阶零,极点滤波器与1个一阶零点滤波
器的级联。其系数由内插后的LSP系数构成的线性预测滤波器AQ)得到,其传输函数为嗍:
也(咖象貉(1舭-1),(a---O.5P'3--0.8p)
(9)
倾斜系数肛首先取max(O.5k,,0),然后进行内插,最后乘以信号相似参数P,其中k.是由解码后的LSP系数变换得到的第1个反射系数,P根据当前内插后的增益G.n与背景噪声的估计值C。得到。
p=铲
(10)
式中。O<p<l。
激励信号进行LPC合成得到合成语音。Ll,C合成使用一个直接形式的滤波器,其系数由插值后的I.SF参数得到。LP合成滤波器的传输函数为吼
-27-
《电子设计工程}20lo年第3期
取0—140000个采样点观察比较。从结果中可看出,MELP编码算法在较低的编码比特率时能较好的重构原始语音信号.从听音测试的结果来看。采用MELP编码的合成语音也能够
式中,童由量化的、内插的LSF参数得到。
合成语音再经以下增益因子调整:
(12)
很好的满足现今通信系统对语音质量的要求。
4.3
MELP与几种不同语音编码算法性能比较嗍以音韵字可懂度测量DRT(diagnostic
fIlyme
test)、满意
度测量DAM(diagnostic
acceptability
test)、平均主观打分
MOS(meanopinionscore)作为性能指标比较几种语音编码算
为保证合成语音连贯性。在一个基音周期内的前10个样点的增益因子是当前帧的因子与前一帧的校正因子的线性内插值。合成语音经脉冲离散滤波器输出。4
4.1
法的性能.如表2所示。
表2几种不同语音编码算法性能比较
MELP编码性能分析及仿真结果
M[ELP声码器参数的比特分配表
MELP编码对原始的语音信号采用8kHz抽样,帧长为
22.5
从表2中可以看出.MELP编码在低速率上获得高质量的合成语音,并且满足通信系统的要求。其编码质量甚至可与4.8kb/s的CELP编码相媲美。
ms,每帧1440比特的语音信号经MELP编码后,输出
仅54个比特数据流。编码过程中各参数所占用的比特分配如表1所示。
表1
MELP声码器比特分配表
5结束语
MELP语音压缩编码算法是在基本的LPC模型上。吸收多带的思想,采用混合激励的形式,因此它兼有LPE和多带激励的优点。MELP的低编码比特率及高语音合成质量必将在未来的无线通信领域发挥重要作用。参考文献:【1】McCree
AV,Barnwell
mT
P.AmixedexcitationLPC
VOCA3-
dermodelforlowbittions
OR
rate
speech
coding[1].IEEE
Transaca-
SpeechandAudio
Processing,1995,3(4):242—250.
【2】张雄伟,陈亮,杨吉斌.现代语音处理技术及应用【M】.北京:机械工业出版社.2003.
4.2合成语音与原始语音信号比较
图3是经过MA7FLAB软件仿真后得到的合成语音信号和原始语音信号的波形与频谱比较图,仿真所用的采样频率为8kHz,每个采样点用8bit比特进行量化。为便于观察,选
【3】王洪,唐凯.低速率语音编码【M】.北京:国防工业出版社,
2006.
【4】鲍长春.数字语音编码原理【M】.西安:西安电子科技大学出
版社.2007.【5】AlanV
McCree,KwanTruong。BryanGeorgeE,etaLA2.4Kbitps
new
MELPcodercandidatefort11e
U.S.Federal[J].Proceeding
of
ICASSP。1998(5):1们k112
【6l钟明.一种2.4Kbps改进型MBELP编码[J]Joumal
tronics.2000(5):122一124.
ofElec-
f7】7
GriffinD
W,LimJS.Multibandexciationvocoder[J].IEEE-
TransonASSP,1998,36(8):1223—1235.
【8】吴家安.现代语音缡码技术【M】.北京:科学出版社,2008.【9】刘宽海,葛万成.MELP低比特率数字语音编码技术研究
【J】.InformationTechnology,2003,27(8):52—54.
(c)原始信号频谱
(d)合成语音频谱
【101潘军,丁晓明.低速率语音编码技术与应用叨.电声技术,
图3
MELP原始语音与合成语音比较
200l。188(2):33-36.
-28-
万方数据
混合激励线性预测低速率语音编码研究
作者:作者单位:刊名:英文刊名:年,卷(期):
贾亮, 赵鹏飞, 危国腾, JIA Liang, ZHAO Peng-fei, WEI Guo-teng沈阳航空工业学院,电子与信息工程学院,辽宁,沈阳110136电子设计工程
ELECTRONIC DESIGN ENGINEERING2010,18(3)
参考文献(10条)
1. 刘宽海;葛万成 MELP低比特率数字语音编码技术研究[期刊论文]-Information Technology 2003(08)2. 吴家安 现代语音编码技术 2008
3. Griffin D W;Lim J S Multiband exciation vocoder 1998(08)
4. 钟明 一种2.4 Kbps改进型MBELP编码[期刊论文]-Joumal of Electronics 2000(05)
5. AlanV McCree;KwanTruong;Bryan George E A 2.4Kbitps MELP coder candidate for the new U.S.Federal1998(05)
6. 鲍长春 数字语音编码原理 20077. 王洪;唐凯 低速率语音编码 2006
8. 张雄伟;陈亮;杨吉斌 现代语音处理技术及应用 2003
9. 潘军;丁晓明 低速率语音编码技术与应用[期刊论文]-电声技术 2001(02)
10. McCree A V;Barnwell III T P A mixed excitation LPC voco-der model for low bit rate speech coding1995(04)
本文链接:http://d.g.wanfangdata.com.cn/Periodical_dzsjgc201003010.aspx