
电话线路上的模拟语音信号,经话路带宽滤波(符合ITU-T G.712建议)后,被8kHz采样,量化成16bit线性PCM数字信号输入到编码器。该编码器是基于线性预测分析合成技术,尽量减少实际语音与合成语音之间经听觉加权后差分信号的能量为准则来进行编码的。编码器的结构框图如图1所示,其主要部分有:
·线性预测分析和LPC系数的量化;
·开环基音周期估计;
·自适应码本搜索;
·固定码本搜索;
·码本增益量化。
下面分别描述这五部分的主要技术。
·线性预测分析与LPC系数的量化
首先对信号进行加线性预测分析窗,分析窗由两部分组成。第一部分是半个汉明窗,第二部分是四分之一个余弦信号。将加窗后的语音信号通过LevinsonDurbin算法获得线性预测滤波器系数ai i=1......10。由于线谱对参数比线性预测系数具有更好的内插特性和量化特性[3], G.729将LPC参数转换成相应的线谱对参数,最后对线谱对参数进行量化。
·开环基音分析
为了减少自适应码本搜索的复杂度,需要计算开环基音Top,使自适应码本搜索在开环基音值附近进行。基音值的范围在18~145个样本点之间。
·自适应码本搜索
G.729对每个子帧进行闭环基音搜索,它通过最小化原始语音信号和重构语音信号的加权均方误差来进行闭环基音搜索。对子帧1的闭环基音T1的搜索是局限在开环基音Top的一个小范围内,对子帧2的闭环基音T2的搜索是局限在闭环基音T1的一个小范围内。这样可以减少基音搜索的复杂度。
·固定码本搜索
G.729固定码本矢量含有四个非0脉冲,每个脉冲的幅度要可以是+1或-1。通过最小化加权语音信号和加权重构语音信号的均方误差来进行固定码本的搜索。
·增益量化
G.729对自适应码本增益和固定码本增益采用二级共轭结构码本进行矢量量化。在码本搜索时,采用预搜索策略,使得运算量只为全搜索算法的1/4。