混合激励线性预测低速率语音编码研究

第１８卷第３期

电子设计工程

２０１０年３月

Ｖ０１．１８

Ｎｏ．３

ＥｌｅｃｔｒｏｎｉｃＤｅｓｉｇｎＥｎｇｉｎｅｅｒｉｎｇ

Ｍａｒ．２０１０

混合激励线性预测低速率语音编码研究

贾亮，赵鹏飞．危国腾

（沈阳航空工业学院电子与信息工程学院。辽宁沈阳１１０１３６）

摘要：为了满足数字通信及其他商业应用的需求．语音压缩编码技术得到迅速发展。近年来主流的低速率语音缡码方案主要基于Ｕ，ｃ一１０，混合激励线性预测（ＭＥＬＰ），多带激励缟码（ＭＢＥ），正弦变换缡码（ＳＣＩ），波形内插编码（ＷＩ），大多都工作在２．４ｋｌｇｓ速率下。作为一种重要的低速率语音缡码算法．ＭＥＬＰ算法对Ｕ，ｃ—ｌＯ编码方案进行大量改进，引入混合激励，非周期脉冲。残差付氏幅度谱，脉冲散布和自适应谱滤波５个特征。实验结果表明，该混合激励线性预测编码在２．４ｋｂ／ｓ上得到了更好的合成语音．并使得合成语音能更好地拟舍自然语音。关键词：混合激励线性预潮（ＭＥＬＰ）；语音鳊码；混合激励；脉冲散布中圈分类号：ＴＮ９１２．３

文献标识码：Ａ

文章编号：１６７４－６２３６（２０ｌＯ）０３埘２５—０４

Ｒｅｓｅａｒｃｈｏｆ

ＭＥＬＰ

ｌｏｗｂｉｔｒａｔｅｍｇｉｔａｌｓｐｅｅｃｈｃｏｄｉｎｇ

ＪＩＡＬｉａｎｇ，ＺＨＡＯＰｅｎｇ－ｆｅｉ，ＷＥＩＧｕｏ－ｔｅｎｇ

（ＳｃｈｏｏｌｏｆＥｌｅｃｔｒｏｎｉｃａｎｄＩｎｆｏｒｍａｔｉｏｎ

Ｅｎｇｉｎｅｅｒｉｎｇ，ＳｈｅｎｙａｎｇＩｎｓｔｉｔｕｔｅｏｆＡｅｒｏｎａｕｔｉｃａｌＥ堙妇ｅｒ打垮，Ｓｈｅｎｙａｎｇ

１

１０１３６，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：Ｉｎ

ｏｒｄｅｒ

ｔｏ

ｓａｔｉｓ匆ｄｅｍａｎｄｓｏｆｔｈｅ

ｄｉｇｉｔａｌｃｏｍｍｕｎｉｃａｔｉｏｎａｎｄｏｔｈｅｒｃｏｍｍｅｒｃｉａｌａｐｐｌｉｃａｔｉｏｎｓ，ｔｈｅｓｐｅｅｃｈｃｏｍｐｒｅｓ－

ｓｉｏｎｔｅｃｈｎｏｌｏｇｙｈａｓｂｅｅｎｄｅｖｅｌｏｐｅｄｒａｐｉｄｌｙ．Ｔｈｅｒｅａ∞ｓｅｖｅｒａｌｍａｉｎＬＢＲＳＣｐｒｅｖａｉｌｉｎｇｉｎ

ｒｅｃｅｎｔ

ｙｅａｒｓ．ｓｕｃｈ

ａ８

ｌｉｎｅｐｒｅｄｉｃ・

Ｏｏｎ

ｃｏｄｉｎｇ（Ｌｌ屯－１０），ｍｉｘｅｄｅｘｃｉｔａｔｉｏｎｌｉｎｅｐｒｅｄｉｃｔｉｏｎ（ＭＥＬＰ），ｍｕｌｔｉ－ｂａｎｄｅｘｃｉｔａｔｉｏｎ（ＭＢＥ），ｓｉｎｕｓｅｉｄａｌｔｒａｎｓｆｏｒｍｃｏｒｄｉｎｇ

（ＳＴＣ）。ａｎｄｗａｖｅｆｏｒｍｉｎｔｅｒｐｏｌａｔｉｏｎ（Ｗ１），ｍｏｓｔｏｆｗｈｉｃｈｗｏｒｋｓ

ａｔ

ｔｈｅ

ｍｔｅｏｆ２．４ｋｂ／ｓ．ＭＥＬＰａｌｇｏｒｉｔｈｍｉｓｂａｓｅｄ

ｏｎ

ｔｈｅｂａｓｉｓ

ｏｆＬｉｎｅ

Ｐｒｅｄｉｃｔｉｏｎ（ＬＰ）．ＦｉｖｅｃｈａｒａｃｔｅｒｓｈａｓｂｅｅｎｉｎｔｒｏｄｕｃｅｄｉｎｔｏＭＥＬＰａｌｇｏｒｉｔｈｍ，ｔＩｌｅｙａ糟ｍｉｘｅｄｅｘｃｉｔａｔｉｏｎ，ａｐｅｒｉｏｄｉｃ

ｐｕｌｓｅ．Ｆｏｕｒｉｅｒｍａｇｎｉｔｕｄｅｓｐｕｌｓｅｄｉｓｐｅｒｓｉｏｎａｎｄａｄａｐｔｉｖｅｓｐｅｃｔｒａｌｆｉｌｔｅｒｉｎｇ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｅｍｉｘｅｄ

ｅｘ－

ｃｉｔａｔｉｏｎｌｉｎｅａｒｐｒｅｄｉｃｔｉｖｅｃｏｄｉｎｇｉｎｔｈｅ２．４ｋｂ／ｓ

ｇｉｗ

ａ

ｂｅｔｔｅｒ

ｓｙｎｔｈｅｓｉｚｅｄｓｐｅｅｃｈ，ａｎｄｍａｋｅｓｔｈｅｓｙｎｔｈｅｓｉｚｅｄｓｐｅｅｃｈ

ｔｏ

ｂｅｔｔｅｒ

ｆｉｔｔｌｌｅ

ｎａｔｕｒａｌ

ｖｏｉｃｅ．

Ｋｅｙ

ｗｏｒｄｓ：ｍｉｘｅｄ－ｅｘｃｉｔａｔｉｏｎｌｉｎｅａｒｐｒｅｄｉｃｔｉｖｅ（ＭＥＬＰ）；ｓｐｅｅｃｈｃｏｄｉｎｇ；ｍｉｘｅｄｅｘｃｉｔａｔｉｏｎ；ｐｕｌｓｅｄｉｓｐｅｒｓａｌ

近年来，随着人们对通信需求的不断增加。在各种通信声码器采用周期脉冲串或白噪声作为全极点合成滤波器的系统中。信道资源愈来愈宝贵。对于主要通信业务之一的语激励．为了改善ＬＰＣ声码器的音质，ＭＥＬＰ编码技术把语音音通信，利用尽量少的资源来传输语音的需求更为迫切。特分为清音、浊音和抖动浊音３种状态。

别是在军事通信中。２．４＿４．８ｋｂ／ｓ速率的语音编码的需求尤为迫切。因此需压缩语音信号的传输带宽或降低电话信道的传陬硐——一

输码率，语音编码在其中十分重要。

直基音初估

流糊

ｌ滤

２．４

ｋｂ／ｓ混合激励线性预测ＭＥＬＰ（ｍｉｘｅｄ－ｅｘｃｉｔａｔｉｏｎ

ｌｉｎｅａｒ

滤斟卜

波

ｐｒｅｄｉｃｔｉｖｅ）低比特率数字语音编码技术ｔ’Ｉ是在基本线性预测

通＿１标志位ｌ

岖驷

’ｕＬ也

编码ＬＰＣ（１ｉｎｅａｒｐｒｅｄｉｃｔｉｖｅｃｅｄｉｎｇ）的基础上结合混合激励、多

带带激励以及原型波形内插等编码方法的优点。采用一种更符分析

合人类发音机制的语音生成模型来合成语音。并利用自适应豢要

１增Ｉ。一蕊卜匦

频谱增强技术。提高合成语音与原始语音的匹配度，从而实计蟮

现低码率、高质量的合成语音。ｌ

ＭＥＬＰ语音编码技术的基本原理

图ｌ四表示数字化后的信号通过一个４阶切比雪夫高通

滤波器．滤除５０Ｈｚ直流工频干扰，ＭＥＬＰ编码采用多带混合激励进行清浊音判决，以提取准确的基音信号。传统的Ｕ．ｃ坠一

纂图ｌ

ＭＥＬＰ编码器原理

收稿日期：２００９．０９—０７

稿件编号：２００９０９０２３

作者简介：贾壳（１９７ｌ一），男，辽宁大石桥人，剐教授。研究方向：信号与信息处理。

一２５一

万　

方数据

《电子设计工程））２０７０年第３期

线性预测主要分为输入语音信号的分析和残差信号的分析２部分。若浊音段信号的周期性不是很好时．通过非周期性标志在解码端采用与之相适应的激励源激励不稳定的声带脉冲。

ＭＥＬＰ按照感知加权失真度最小的逼近准则．采用４级码本的快速搜索矢量量化算法，大大缩短码本搜索时间。经误码检测的比特流打包后，通过通信系统发送，锯码器在接收端重构输入信号．尽管ＭＥＬＰ编码不能完整的恢复出原始信号，但从计算机模拟仿真结果可看出．ＭＥＬＰ在较低的比特率上．产生了高质量的重构语音信号。ＭＥＬＰ编码中的关键技术

采用多带混合激励是ＭＥＬＰ模型最霞要的特征，传统ＬＰＣ编码算法在每一帧中仪对输入信号进行一次清浊音判决。在解码端也简单用一个清浊音开关表示。不能完整表达ｋｂ／ｓ的ＭＥＬＰ算法中。将０～４ｋＨｚ的语ｋＨｚ，０．５～１ｋＨｚ，１—２ｋＨｚ，２—３ｋＨｚ，３－４ｋＨｚ

５

分带滤波器由５个６阶的巴特沃思带通滤波器相加得到，滤波后的语音信号经全波整流及平滑滤波．再进行清浊采用混合激励可以减少合成语音中的蜂呜噪声。但若需在编码端用非周期标志来标识周期性不是很强的浊音人说话时声道的共振峰带宽即使在一个基音周期内也

自适应谱增强技术１４１通过让激励信号经过自适应谱增强

－２６－

万　

方数据滤波器而实现。ｆ－Ｉ适应谱增强滤波器由系数自适应变化的、阶数等于线性预测阶数的零极点滤波器与一阶全极点滤波器级联而成的滤波器组组合而成。通过突出激励谱中共振峰频率处的谱幅度，可以提高整个短时谱在共振峰处的信噪

ｌ箍倒。㈣＠一

囱囱制｜｜俐驴２

２．１多带混合激励

语音信号所含的丰富激励信息。多带的思想来源于ＭＢＥ算法。采用多带处理在频域更精细的划分激励信号．所合成的激励也更准确。在２．４音信号在０～０．５

个频段分别进行清浊音判决处理。

音判决，从而得到对应频带的基音。采用多带混合激励重构原始信号时．采用一个随频率变化的清浊音判决器取代简单的清浊音开关，用混合激励取代简单的二元激励，从而得到一个与短时谱相对应的、具有清音和浊音混合成分的激励谱，大大提高了合成语音的质量。２．２使用非周期脉冲

处理的信号基音较高同时义伴有噪声时．通常在激励信号中混入较多的低频白噪声以减弱其周期性．但这样会给合成语音引入杂音．在ＭＥＬＰ算法巾使用一种更有效的处理办法一非周期脉冲１３１。

段，这样接收端解码时根据非周期性标志让基音周期在一个区问随机变动．以减弱合成语音的周期性。采用该方法可较好地模拟那些不稳定的声门脉冲，使合成语音激励更加逼近原始语音激励。

２．３自适应谱增强技术

可能发牛变化。并且Ｉ戌这种全极点模型削弱共振峰的特

征，这使得ＬＰＣ合成滤波器的极点形状与自然语音的共振峰形状之间存在一定偏差，导致在共振峰之间合成语音谱的波谷不如原始语音谱的波谷尖锐。使合成语音在人耳听来感觉

有点发闷。

贾亮。等混合激励线性预测低速率语音编码研究

模式；若为ｎ－－２，则说明发生２ｂｉｔ的错误，无法纠正，使用帧丢弃，用上一帧的参数取代它；若ｎ＞２，解码出对数基音值，经反对数变换还原成原来的基音值，使用浊音模式。在清音模式下，对（８，４）汉明码解码，纠正单个比特的错误和检测双比特错误。若检测到一个不可纠正的错误，则给出一个帧丢弃指示。否则。解码出（７，４）汉明码并纠正该单个错误。合成的语音模式有以下３种：

１）帧删除模式

当解码时检测到不可纠正的错误时使

用该模式，用前一帧的参数代替当前帧的参数，并使Ｇｌ＿Ｇ２，不改变增益。

２）清音模式

在清音模式下将对基音、基音抖动、带通

浊音强度和残差谱的傅里叶级数等激励参数都使用缺省参数值。基音值被设为５０个取样，基音抖动值设为２５％。所有的带通浊音强度都设为０，残差谱的系数全置为１。Ｉ＿ＳＦ和增益参数则给予正常的解码。

３）浊音模式此时Ｖｋ．为１，若非周期标志为ｌ，则基音抖动为２５％，否则为０。若ｙ晡为１。则其对应的带通浊音强度为ｌ，否则为Ｏ。若ｙｗ（ｆ－２，３，４，５）为０００１，则ｙ够设为０。

对于ＬＳＦ．首先通过对应的码字找到每一级最佳码本矢量。然后对这４级最佳码本求和。求得的矢量和就是解码出的ＬＳＦ参数。解码出残差谱的傅里叶级数尺Ｋ），（尺＝ｌ，２，…，１０）为其码字所对应的最佳码矢量。对于增益，需解码Ｃ，和Ｇ：，应先解主增益Ｃ２，再解ＧＩ。

３．２噪声抑制

ＭＥＬＰ算法采用能量相减方法去噪．通过统计值控制总的合成增益衰减，该方法认为噪声平均分配在所有频段。使用自适应噪声谱相减法抑制噪声。实际应用时通过对解码后的增益参量进行小的增益衰减来实现。衰减对２个增益进行，对Ｇ。衰减前需先更新背景噪声估计值皖，若Ｇｌ＞Ｃ。＋Ｇ。，则ＧＩ＝Ｇ。＋Ｇ。；若Ｇｌ＜Ｃ。一Ｇｄ。，贝０Ｇｌ＝Ｇ。一Ｇｄ。。，否贝０

Ｇｌ＝Ｇ。，

Ｇ。ｖ－－Ｏ．３３７４３５，Ｇｂ．－－Ｏ．１３５

４１８，对于每秒８８．９次的增益修正

率，噪声估计值最大每秒上升３ｄＢ，或每秒下降１２ｄＢ，估计值在１０～８０之间。通过扣除修正项Ｇ。调整增益Ｇ。，Ｇ。表达式

如下：

Ｇ。＝－ｌＯｌｇ［１－１０ａ。‘甜均’】

（３）

式中，Ｇ。最大值为６ｄＢ，Ｇ。上限为２０ｄＢ。

３．３参数插值

’

ＭＥＬＰ对增益、ＩＳＦ、基音周期、基音抖动、残差谱傅里叶级数、混合激励脉冲和噪声比例、自适应谱增强滤波器的频谱倾斜系数都进行插值。若新的基音周期起点ｔ。（０，ｌ，…，１７９）的值小于９０，则增益在前一帧的第２个增益Ｇ知和Ｇ，当前帧的第１个增益Ｇ。之间线性插值；否则增益在本帧Ｇ。和Ｇ：之间插值。其他参数在前一帧的值和当前帧的值之间线性插值。插值因子ｉｎｔ根据新的基音周期的起点决定。

ｉｎｔ＝ｔｏ／１８０

（４）

若Ｇ．比Ｃ知大６ｄＢ，且当前帧的基音值不到前一帧基音值的一半时，则认为是过渡帧，这时直接使用新的基音值而

万　

方数据无需插值。若Ｃ：与Ｇ知相差６ｄＢ以上，表明前后两帧参数差异较大，这时用增益计算插值因子，此时插值因子ｉｎｔ为：

ｉｎｔ＝镑

（５）

３．４混合激励旧ＭＥＬＰ激励是分带滤波后的脉冲和噪声激励之和。脉冲激

励ｅｐ（ｎ）（ｎ＝Ｏ，ｌ，…，弘１）用长度为一个基音周期的离散傅里

叶反变换计算得到：

郎（ｎ）＝专∑Ｍ（ｋ）ｅｘｐ（ｊ２１ｒｎｋ／Ｔ）

（６）

式中．ｒ等于插值后的基音值加上基音抖动强度与基音之积所得的和，Ｍ（ｋ）由插值后的残差谱的傅里叶级数Ｆ（ｋ）（ｋ＝ｌ，２，…，１０）生成。一般认为脉冲激励相位为０，因此Ｍ（ｋ）是实数，因ｅ。（，１）为实数，Ｍ（ｋ）满足：

Ｍ（７Ｌｌ｜｝）＝肘（后）。

（蠡＝ｌ，２，…，￡）（７）

若７’为偶数，则￡＝耽；否则Ｌ＝（Ｔ－Ｉ）／２。直流项肘（０）被

置为０，系数项肘（｜｜｝）表达式如下：

肘ｃ矗，＝（：’：竺ｉＩ；后＝１’２，…＇１。’

ｃ８，

为了防止均匀周期开始的剧变，所生成的脉冲激励要循环移位延迟１０个取样．以使主激励脉冲位于基音周期的第ｌＯ个取样点的位置上。然后用脉冲激励信号乘以基音周期的平方根，保持信号ＲＭＳ的一致。对得到的脉冲激励进行电平调整。将其乘以ｌ０００．保证与一般信号的幅度相一致。噪声用同余法产生均匀分布白噪声，其ＲＭＳ值为１０００。随机范围在±１７３２之间。经电平调整和限幅后的信号作为噪声源。当前帧的脉冲合成滤波器由浊音频带的带通滤波器系数之和给出。噪声合成滤波器由清音频带的带通滤波器系数之和给出。脉冲和噪声源各自滤波后相加合成混合激励。合成滤波器的作用相当于依据各子带清／浊音判决对子带激励信号从频域加权求和。３．５语音合成

混合激励信号合成后经过自适应谱增强滤波器进行处理，滤波器是一个１０阶零，极点滤波器与１个一阶零点滤波

器的级联。其系数由内插后的ＬＳＰ系数构成的线性预测滤波器ＡＱ）得到，其传输函数为嗍：

也（咖象貉（１舭－１），（ａ－－－Ｏ．５Ｐ＇３－－０．８ｐ）

（９）

倾斜系数肛首先取ｍａｘ（Ｏ．５ｋ，，０），然后进行内插，最后乘以信号相似参数Ｐ，其中ｋ．是由解码后的ＬＳＰ系数变换得到的第１个反射系数，Ｐ根据当前内插后的增益Ｇ．ｎ与背景噪声的估计值Ｃ。得到。

ｐ＝铲

（１０）

式中。Ｏ＜ｐ＜ｌ。

激励信号进行ＬＰＣ合成得到合成语音。Ｌｌ，Ｃ合成使用一个直接形式的滤波器，其系数由插值后的Ｉ．ＳＦ参数得到。ＬＰ合成滤波器的传输函数为吼

－２７－

《电子设计工程｝２０ｌｏ年第３期

取０—１４００００个采样点观察比较。从结果中可看出，ＭＥＬＰ编码算法在较低的编码比特率时能较好的重构原始语音信号．从听音测试的结果来看。采用ＭＥＬＰ编码的合成语音也能够

式中，童由量化的、内插的ＬＳＦ参数得到。

合成语音再经以下增益因子调整：

（１２）

很好的满足现今通信系统对语音质量的要求。

４．３

ＭＥＬＰ与几种不同语音编码算法性能比较嗍以音韵字可懂度测量ＤＲＴ（ｄｉａｇｎｏｓｔｉｃ

ｆＩｌｙｍｅ

ｔｅｓｔ）、满意

度测量ＤＡＭ（ｄｉａｇｎｏｓｔｉｃ

ａｃｃｅｐｔａｂｉｌｉｔｙ

ｔｅｓｔ）、平均主观打分

ＭＯＳ（ｍｅａｎｏｐｉｎｉｏｎｓｃｏｒｅ）作为性能指标比较几种语音编码算

为保证合成语音连贯性。在一个基音周期内的前１０个样点的增益因子是当前帧的因子与前一帧的校正因子的线性内插值。合成语音经脉冲离散滤波器输出。４

４．１

法的性能．如表２所示。

表２几种不同语音编码算法性能比较

ＭＥＬＰ编码性能分析及仿真结果

Ｍ［ＥＬＰ声码器参数的比特分配表

ＭＥＬＰ编码对原始的语音信号采用８ｋＨｚ抽样，帧长为

２２．５

从表２中可以看出．ＭＥＬＰ编码在低速率上获得高质量的合成语音，并且满足通信系统的要求。其编码质量甚至可与４．８ｋｂ／ｓ的ＣＥＬＰ编码相媲美。

ｍｓ，每帧１４４０比特的语音信号经ＭＥＬＰ编码后，输出

仅５４个比特数据流。编码过程中各参数所占用的比特分配如表１所示。

表１

ＭＥＬＰ声码器比特分配表

５结束语

ＭＥＬＰ语音压缩编码算法是在基本的ＬＰＣ模型上。吸收多带的思想，采用混合激励的形式，因此它兼有ＬＰＥ和多带激励的优点。ＭＥＬＰ的低编码比特率及高语音合成质量必将在未来的无线通信领域发挥重要作用。参考文献：【１】ＭｃＣｒｅｅ

ＡＶ，Ｂａｒｎｗｅｌｌ

ｍＴ

Ｐ．ＡｍｉｘｅｄｅｘｃｉｔａｔｉｏｎＬＰＣ

ＶＯＣＡ３－

ｄｅｒｍｏｄｅｌｆｏｒｌｏｗｂｉｔｔｉｏｎｓ

ＯＲ

ｒａｔｅ

ｓｐｅｅｃｈ

ｃｏｄｉｎｇ［１］．ＩＥＥＥ

Ｔｒａｎｓａｃａ－

ＳｐｅｅｃｈａｎｄＡｕｄｉｏ

Ｐｒｏｃｅｓｓｉｎｇ，１９９５，３（４）：２４２—２５０．

【２】张雄伟，陈亮，杨吉斌．现代语音处理技术及应用【Ｍ】．北京：机械工业出版社．２００３．

４．２合成语音与原始语音信号比较

图３是经过ＭＡ７ＦＬＡＢ软件仿真后得到的合成语音信号和原始语音信号的波形与频谱比较图，仿真所用的采样频率为８ｋＨｚ，每个采样点用８ｂｉｔ比特进行量化。为便于观察，选

【３】王洪，唐凯．低速率语音编码【Ｍ】．北京：国防工业出版社，

２００６．

【４】鲍长春．数字语音编码原理【Ｍ】．西安：西安电子科技大学出

版社．２００７．【５】ＡｌａｎＶ

ＭｃＣｒｅｅ，ＫｗａｎＴｒｕｏｎｇ。ＢｒｙａｎＧｅｏｒｇｅＥ，ｅｔａＬＡ２．４Ｋｂｉｔｐｓ

ｎｅｗ

ＭＥＬＰｃｏｄｅｒｃａｎｄｉｄａｔｅｆｏｒｔ１１ｅ

Ｕ．Ｓ．Ｆｅｄｅｒａｌ［Ｊ］．Ｐｒｏｃｅｅｄｉｎｇ

ｏｆ

ＩＣＡＳＳＰ。１９９８（５）：１们ｋ１１２

【６ｌ钟明．一种２．４Ｋｂｐｓ改进型ＭＢＥＬＰ编码［Ｊ］Ｊｏｕｍａｌ

ｔｒｏｎｉｃｓ．２０００（５）：１２２一１２４．

ｏｆＥｌｅｃ－

ｆ７】７

ＧｒｉｆｆｉｎＤ

Ｗ，ＬｉｍＪＳ．Ｍｕｌｔｉｂａｎｄｅｘｃｉａｔｉｏｎｖｏｃｏｄｅｒ［Ｊ］．ＩＥＥＥ－

ＴｒａｎｓｏｎＡＳＳＰ，１９９８，３６（８）：１２２３—１２３５．

【８】吴家安．现代语音缡码技术【Ｍ】．北京：科学出版社，２００８．【９】刘宽海，葛万成．ＭＥＬＰ低比特率数字语音编码技术研究

【Ｊ】．ＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ，２００３，２７（８）：５２—５４．

（ｃ）原始信号频谱

（ｄ）合成语音频谱

【１０１潘军，丁晓明．低速率语音编码技术与应用叨．电声技术，

图３

ＭＥＬＰ原始语音与合成语音比较

２００ｌ。１８８（２）：３３－３６．

－２８－

万方数据　

混合激励线性预测低速率语音编码研究

作者：作者单位：刊名：英文刊名：年，卷(期)：

贾亮，赵鹏飞，危国腾， JIA Liang， ZHAO Peng-fei， WEI Guo-teng沈阳航空工业学院,电子与信息工程学院,辽宁,沈阳110136电子设计工程

ELECTRONIC DESIGN ENGINEERING2010,18(3)

参考文献(10条)

1. 刘宽海;葛万成 MELP低比特率数字语音编码技术研究[期刊论文]-Information Technology 2003(08)2. 吴家安现代语音编码技术 2008

3. Griffin D W;Lim J S Multiband exciation vocoder 1998(08)

4. 钟明一种2.4 Kbps改进型MBELP编码[期刊论文]-Joumal of Electronics 2000(05)

5. AlanV McCree;KwanTruong;Bryan George E A 2.4Kbitps MELP coder candidate for the new U.S.Federal1998(05)

6. 鲍长春数字语音编码原理 20077. 王洪;唐凯低速率语音编码 2006

8. 张雄伟;陈亮;杨吉斌现代语音处理技术及应用 2003

9. 潘军;丁晓明低速率语音编码技术与应用[期刊论文]-电声技术 2001(02)

10. McCree A V;Barnwell III T P A mixed excitation LPC voco-der model for low bit rate speech coding1995(04)

本文链接：http://d.g.wanfangdata.com.cn/Periodical_dzsjgc201003010.aspx

第１８卷第３期

电子设计工程

２０１０年３月

Ｖ０１．１８

Ｎｏ．３

ＥｌｅｃｔｒｏｎｉｃＤｅｓｉｇｎＥｎｇｉｎｅｅｒｉｎｇ

Ｍａｒ．２０１０

混合激励线性预测低速率语音编码研究

贾亮，赵鹏飞．危国腾

（沈阳航空工业学院电子与信息工程学院。辽宁沈阳１１０１３６）

文献标识码：Ａ

文章编号：１６７４－６２３６（２０ｌＯ）０３埘２５—０４

Ｒｅｓｅａｒｃｈｏｆ

ＭＥＬＰ

ｌｏｗｂｉｔｒａｔｅｍｇｉｔａｌｓｐｅｅｃｈｃｏｄｉｎｇ

ＪＩＡＬｉａｎｇ，ＺＨＡＯＰｅｎｇ－ｆｅｉ，ＷＥＩＧｕｏ－ｔｅｎｇ

（ＳｃｈｏｏｌｏｆＥｌｅｃｔｒｏｎｉｃａｎｄＩｎｆｏｒｍａｔｉｏｎ

Ｅｎｇｉｎｅｅｒｉｎｇ，ＳｈｅｎｙａｎｇＩｎｓｔｉｔｕｔｅｏｆＡｅｒｏｎａｕｔｉｃａｌＥ堙妇ｅｒ打垮，Ｓｈｅｎｙａｎｇ

１

１０１３６，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：Ｉｎ

ｏｒｄｅｒ

ｔｏ

ｓａｔｉｓ匆ｄｅｍａｎｄｓｏｆｔｈｅ

ｒｅｃｅｎｔ

ｙｅａｒｓ．ｓｕｃｈ

ａ８

ｌｉｎｅｐｒｅｄｉｃ・

Ｏｏｎ

（ＳＴＣ）。ａｎｄｗａｖｅｆｏｒｍｉｎｔｅｒｐｏｌａｔｉｏｎ（Ｗ１），ｍｏｓｔｏｆｗｈｉｃｈｗｏｒｋｓ

ａｔ

ｔｈｅ

ｍｔｅｏｆ２．４ｋｂ／ｓ．ＭＥＬＰａｌｇｏｒｉｔｈｍｉｓｂａｓｅｄ

ｏｎ

ｔｈｅｂａｓｉｓ

ｏｆＬｉｎｅ

ｅｘ－

ｃｉｔａｔｉｏｎｌｉｎｅａｒｐｒｅｄｉｃｔｉｖｅｃｏｄｉｎｇｉｎｔｈｅ２．４ｋｂ／ｓ

ｇｉｗ

ａ

ｂｅｔｔｅｒ

ｓｙｎｔｈｅｓｉｚｅｄｓｐｅｅｃｈ，ａｎｄｍａｋｅｓｔｈｅｓｙｎｔｈｅｓｉｚｅｄｓｐｅｅｃｈ

ｔｏ

ｂｅｔｔｅｒ

ｆｉｔｔｌｌｅ

ｎａｔｕｒａｌ

ｖｏｉｃｅ．

Ｋｅｙ

别是在军事通信中。２．４＿４．８ｋｂ／ｓ速率的语音编码的需求尤为迫切。因此需压缩语音信号的传输带宽或降低电话信道的传陬硐——一

输码率，语音编码在其中十分重要。

直基音初估

流糊

ｌ滤

２．４

ｋｂ／ｓ混合激励线性预测ＭＥＬＰ（ｍｉｘｅｄ－ｅｘｃｉｔａｔｉｏｎ

ｌｉｎｅａｒ

滤斟卜

波

ｐｒｅｄｉｃｔｉｖｅ）低比特率数字语音编码技术ｔ’Ｉ是在基本线性预测

通＿１标志位ｌ

岖驷

’ｕＬ也

编码ＬＰＣ（１ｉｎｅａｒｐｒｅｄｉｃｔｉｖｅｃｅｄｉｎｇ）的基础上结合混合激励、多

带带激励以及原型波形内插等编码方法的优点。采用一种更符分析

合人类发音机制的语音生成模型来合成语音。并利用自适应豢要

１增Ｉ。一蕊卜匦

频谱增强技术。提高合成语音与原始语音的匹配度，从而实计蟮

现低码率、高质量的合成语音。ｌ

ＭＥＬＰ语音编码技术的基本原理

图ｌ四表示数字化后的信号通过一个４阶切比雪夫高通

滤波器．滤除５０Ｈｚ直流工频干扰，ＭＥＬＰ编码采用多带混合激励进行清浊音判决，以提取准确的基音信号。传统的Ｕ．ｃ坠一

纂图ｌ

ＭＥＬＰ编码器原理

收稿日期：２００９．０９—０７

稿件编号：２００９０９０２３

作者简介：贾壳（１９７ｌ一），男，辽宁大石桥人，剐教授。研究方向：信号与信息处理。

一２５一

万　

方数据

《电子设计工程））２０７０年第３期

５

自适应谱增强技术１４１通过让激励信号经过自适应谱增强

－２６－

万　

ｌ箍倒。㈣＠一

囱囱制｜｜俐驴２

２．１多带混合激励

个频段分别进行清浊音判决处理。

２．３自适应谱增强技术

可能发牛变化。并且Ｉ戌这种全极点模型削弱共振峰的特

有点发闷。

贾亮。等混合激励线性预测低速率语音编码研究

１）帧删除模式

当解码时检测到不可纠正的错误时使

用该模式，用前一帧的参数代替当前帧的参数，并使Ｇｌ＿Ｇ２，不改变增益。

２）清音模式

在清音模式下将对基音、基音抖动、带通

３．２噪声抑制

Ｇｌ＝Ｇ。，

Ｇ。ｖ－－Ｏ．３３７４３５，Ｇｂ．－－Ｏ．１３５

４１８，对于每秒８８．９次的增益修正

率，噪声估计值最大每秒上升３ｄＢ，或每秒下降１２ｄＢ，估计值在１０～８０之间。通过扣除修正项Ｇ。调整增益Ｇ。，Ｇ。表达式

如下：

Ｇ。＝－ｌＯｌｇ［１－１０ａ。‘甜均’】

（３）

式中，Ｇ。最大值为６ｄＢ，Ｇ。上限为２０ｄＢ。

３．３参数插值

’

ｉｎｔ＝ｔｏ／１８０

（４）

若Ｇ．比Ｃ知大６ｄＢ，且当前帧的基音值不到前一帧基音值的一半时，则认为是过渡帧，这时直接使用新的基音值而

万　

方数据无需插值。若Ｃ：与Ｇ知相差６ｄＢ以上，表明前后两帧参数差异较大，这时用增益计算插值因子，此时插值因子ｉｎｔ为：

ｉｎｔ＝镑

（５）

３．４混合激励旧ＭＥＬＰ激励是分带滤波后的脉冲和噪声激励之和。脉冲激

励ｅｐ（ｎ）（ｎ＝Ｏ，ｌ，…，弘１）用长度为一个基音周期的离散傅里

叶反变换计算得到：

郎（ｎ）＝专∑Ｍ（ｋ）ｅｘｐ（ｊ２１ｒｎｋ／Ｔ）

（６）

Ｍ（７Ｌｌ｜｝）＝肘（后）。

（蠡＝ｌ，２，…，￡）（７）

若７’为偶数，则￡＝耽；否则Ｌ＝（Ｔ－Ｉ）／２。直流项肘（０）被

置为０，系数项肘（｜｜｝）表达式如下：

肘ｃ矗，＝（：’：竺ｉＩ；后＝１’２，…＇１。’

ｃ８，

混合激励信号合成后经过自适应谱增强滤波器进行处理，滤波器是一个１０阶零，极点滤波器与１个一阶零点滤波

器的级联。其系数由内插后的ＬＳＰ系数构成的线性预测滤波器ＡＱ）得到，其传输函数为嗍：

也（咖象貉（１舭－１），（ａ－－－Ｏ．５Ｐ＇３－－０．８ｐ）

（９）

ｐ＝铲

（１０）

式中。Ｏ＜ｐ＜ｌ。

－２７－

《电子设计工程｝２０ｌｏ年第３期

式中，童由量化的、内插的ＬＳＦ参数得到。

合成语音再经以下增益因子调整：

（１２）

很好的满足现今通信系统对语音质量的要求。

４．３

ＭＥＬＰ与几种不同语音编码算法性能比较嗍以音韵字可懂度测量ＤＲＴ（ｄｉａｇｎｏｓｔｉｃ

ｆＩｌｙｍｅ

ｔｅｓｔ）、满意

度测量ＤＡＭ（ｄｉａｇｎｏｓｔｉｃ

ａｃｃｅｐｔａｂｉｌｉｔｙ

ｔｅｓｔ）、平均主观打分

ＭＯＳ（ｍｅａｎｏｐｉｎｉｏｎｓｃｏｒｅ）作为性能指标比较几种语音编码算

４．１

法的性能．如表２所示。

表２几种不同语音编码算法性能比较

ＭＥＬＰ编码性能分析及仿真结果

Ｍ［ＥＬＰ声码器参数的比特分配表

ＭＥＬＰ编码对原始的语音信号采用８ｋＨｚ抽样，帧长为

２２．５

ｍｓ，每帧１４４０比特的语音信号经ＭＥＬＰ编码后，输出

仅５４个比特数据流。编码过程中各参数所占用的比特分配如表１所示。

表１

ＭＥＬＰ声码器比特分配表

５结束语

ＡＶ，Ｂａｒｎｗｅｌｌ

ｍＴ

Ｐ．ＡｍｉｘｅｄｅｘｃｉｔａｔｉｏｎＬＰＣ

ＶＯＣＡ３－

ｄｅｒｍｏｄｅｌｆｏｒｌｏｗｂｉｔｔｉｏｎｓ

ＯＲ

ｒａｔｅ

ｓｐｅｅｃｈ

ｃｏｄｉｎｇ［１］．ＩＥＥＥ

Ｔｒａｎｓａｃａ－

ＳｐｅｅｃｈａｎｄＡｕｄｉｏ

Ｐｒｏｃｅｓｓｉｎｇ，１９９５，３（４）：２４２—２５０．

【２】张雄伟，陈亮，杨吉斌．现代语音处理技术及应用【Ｍ】．北京：机械工业出版社．２００３．

４．２合成语音与原始语音信号比较

【３】王洪，唐凯．低速率语音编码【Ｍ】．北京：国防工业出版社，

２００６．

【４】鲍长春．数字语音编码原理【Ｍ】．西安：西安电子科技大学出

版社．２００７．【５】ＡｌａｎＶ

ＭｃＣｒｅｅ，ＫｗａｎＴｒｕｏｎｇ。ＢｒｙａｎＧｅｏｒｇｅＥ，ｅｔａＬＡ２．４Ｋｂｉｔｐｓ

ｎｅｗ

ＭＥＬＰｃｏｄｅｒｃａｎｄｉｄａｔｅｆｏｒｔ１１ｅ

Ｕ．Ｓ．Ｆｅｄｅｒａｌ［Ｊ］．Ｐｒｏｃｅｅｄｉｎｇ

ｏｆ

ＩＣＡＳＳＰ。１９９８（５）：１们ｋ１１２

【６ｌ钟明．一种２．４Ｋｂｐｓ改进型ＭＢＥＬＰ编码［Ｊ］Ｊｏｕｍａｌ

ｔｒｏｎｉｃｓ．２０００（５）：１２２一１２４．

ｏｆＥｌｅｃ－

ｆ７】７

ＧｒｉｆｆｉｎＤ

Ｗ，ＬｉｍＪＳ．Ｍｕｌｔｉｂａｎｄｅｘｃｉａｔｉｏｎｖｏｃｏｄｅｒ［Ｊ］．ＩＥＥＥ－

ＴｒａｎｓｏｎＡＳＳＰ，１９９８，３６（８）：１２２３—１２３５．

【８】吴家安．现代语音缡码技术【Ｍ】．北京：科学出版社，２００８．【９】刘宽海，葛万成．ＭＥＬＰ低比特率数字语音编码技术研究

【Ｊ】．ＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ，２００３，２７（８）：５２—５４．

（ｃ）原始信号频谱

（ｄ）合成语音频谱

【１０１潘军，丁晓明．低速率语音编码技术与应用叨．电声技术，

图３

ＭＥＬＰ原始语音与合成语音比较

２００ｌ。１８８（２）：３３－３６．

－２８－

万方数据　

混合激励线性预测低速率语音编码研究

作者：作者单位：刊名：英文刊名：年，卷(期)：

贾亮，赵鹏飞，危国腾， JIA Liang， ZHAO Peng-fei， WEI Guo-teng沈阳航空工业学院,电子与信息工程学院,辽宁,沈阳110136电子设计工程

ELECTRONIC DESIGN ENGINEERING2010,18(3)

参考文献(10条)

1. 刘宽海;葛万成 MELP低比特率数字语音编码技术研究[期刊论文]-Information Technology 2003(08)2. 吴家安现代语音编码技术 2008

3. Griffin D W;Lim J S Multiband exciation vocoder 1998(08)

4. 钟明一种2.4 Kbps改进型MBELP编码[期刊论文]-Joumal of Electronics 2000(05)

5. AlanV McCree;KwanTruong;Bryan George E A 2.4Kbitps MELP coder candidate for the new U.S.Federal1998(05)

6. 鲍长春数字语音编码原理 20077. 王洪;唐凯低速率语音编码 2006

8. 张雄伟;陈亮;杨吉斌现代语音处理技术及应用 2003

9. 潘军;丁晓明低速率语音编码技术与应用[期刊论文]-电声技术 2001(02)

10. McCree A V;Barnwell III T P A mixed excitation LPC voco-der model for low bit rate speech coding1995(04)

本文链接：http://d.g.wanfangdata.com.cn/Periodical_dzsjgc201003010.aspx

混合激励线性预测低速率语音编码研究

相关文章