您的位置：首页 > 其它

矢量量化（Vector Quantization）

2015-09-20 23:33 323 查看

动机：在子空间中寻找代表矢量，用此代表矢量来代表子空间中的其它矢量，从而压缩了数据量，即连续矢量映射到了离散矢量上。

The input vector is then replaced by the index of the codeword with the smallest distortion.

Therefore, a description of the vector

quantization process includes:

1. the distortion measure;

2. the generation of each codeword in the codebook;

在最小的失真程度下，输入的矢量被码字序号所代替。

因此，描述一个矢量量化过程需需要包含：

1.失真的度量

2.码本中每一个码字的生成

——《Speech Language Processing》

用数学语言描述矢量量化，事实上是一个连续矢量空间到离散矢量空间的映射过程：

设有N个K维特征矢量

X={X1,X2,...,XN}xn∈RKxi={x1,x2,...,xk}

将RK分成J个不相交子空间。

{⋃Jj=1=RKRi⋂Rj=∅,i≠j

在每一个子空间可以找到代表矢量Y_j

L:X→Y

即量化器。

失真度量函数

度量失真的基本想法就是去测量代表矢量和原始矢量的差距，差距越小，失真程度越小。

1. 基于欧氏距离失真度量函数

- 均方误差d2(X,Y)=(X−Y)T(X−Y)K

- r次方平均误差dr(X,Y)=1K∑Ki=1(xi−yi)r

- r平均误差d′r(X,Y)=[1K∑Ki=1|xi−yi|r]1r

- 绝对值平均误差d1(X,Y)=1K∑Ki=1|xi−yi|

- 最大平均误差dM(X,Y)=max{|xi−yi|}

- 加权d(X,Y)=1K∑Ki=1w(i)(xi−yi)2

对于由线性预测方法求出的LPC系数矢量，由于预测器系数的差值不能代表语音信息的差别，所以不能直接用欧氏距离。为此采用I-S距离，比较系数所描述的信号模型的功率谱。

2. 线性预测失真测度

dI−S(f,f′)=a′TRa′α−ln2α−1

其中，aT=(1,a1,a2,...,ap);R是(p+1)×(p+1)阶自相关矩阵。

a′TRa′=r(0)ra(0)+2∑i=1Pr(i)ra(i)

这里，

r(i)=∑k=0N−1−|i|x(k)x(k+|i|)ra(i)=∑k=0p−iakak+i

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航