您的位置:首页 > 其它

矢量量化(Vector Quantization)

2015-09-20 23:33 323 查看
动机:在子空间中寻找代表矢量,用此代表矢量来代表子空间中的其它矢量,从而压缩了数据量,即连续矢量映射到了离散矢量上。

The input vector is then replaced by the index of the codeword with the smallest distortion.

Therefore, a description of the vector

quantization process includes:

1. the distortion measure;

2. the generation of each codeword in the codebook;

在最小的失真程度下,输入的矢量被码字序号所代替。

因此,描述一个矢量量化过程需需要包含:

1.失真的度量

2.码本中每一个码字的生成

——《Speech Language Processing》

用数学语言描述矢量量化,事实上是一个连续矢量空间到离散矢量空间的映射过程:

设有N个K维特征矢量

X={X1,X2,...,XN}xn∈RKxi={x1,x2,...,xk}

将RK分成J个不相交子空间。

{⋃Jj=1=RKRi⋂Rj=∅,i≠j

在每一个子空间可以找到代表矢量Y_j

L:X→Y

即量化器。

失真度量函数

度量失真的基本想法就是去测量代表矢量和原始矢量的差距,差距越小,失真程度越小。

1. 基于欧氏距离失真度量函数

- 均方误差d2(X,Y)=(X−Y)T(X−Y)K

- r次方平均误差dr(X,Y)=1K∑Ki=1(xi−yi)r

- r平均误差d′r(X,Y)=[1K∑Ki=1|xi−yi|r]1r

- 绝对值平均误差d1(X,Y)=1K∑Ki=1|xi−yi|

- 最大平均误差dM(X,Y)=max{|xi−yi|}

- 加权d(X,Y)=1K∑Ki=1w(i)(xi−yi)2

对于由线性预测方法求出的LPC系数矢量,由于预测器系数的差值不能代表语音信息的差别,所以不能直接用欧氏距离。为此采用I-S距离,比较系数所描述的信号模型的功率谱。

2. 线性预测失真测度

dI−S(f,f′)=a′TRa′α−ln2α−1

其中,aT=(1,a1,a2,...,ap);R是(p+1)×(p+1)阶自相关矩阵。

a′TRa′=r(0)ra(0)+2∑i=1Pr(i)ra(i)

这里,

r(i)=∑k=0N−1−|i|x(k)x(k+|i|)ra(i)=∑k=0p−iakak+i
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: