您的位置:首页 > 编程语言 > Go语言

特征向量和特征值的物理意义

2012-03-11 21:13 351 查看
特征向量体现样本之间的相关程度,特征值则反映了散射强度。
特征向量的几何意义.矩阵(既然讨论特征向量的问题.当然是方阵.这里不讨论广义特征向量的概念)乘以一个向量的结果仍是同维数的一个向量.因此.矩阵乘法对应了一个变换.把一个向量变成同维数的另一个向量.那么变换的效果是什么呢?这当然与方阵的构造有密切关系.比如可以取适当的二维方阵.使得这个变换的效果就是将平面上的二维向量逆时针旋转30度.这时我们可以问一个问题.有没有向量在这个变换下不改变方向呢?可以想一下.除了零向量.没有其他向量可以在平面上旋转30度而不改变方向的.所以这个变换对应的矩阵(或者说这个变换自身)没有特征向量(注意:特征向量不能
是零向量).所以一个变换的特征向量是这样一种向量.它经过这种特定的变换后保持方向不变.只是进行长度上的伸缩而已(再想想特征向量的原始定义Ax= cx.你就恍然大悟了.看到了吗?cx是方阵A对向量x进行变换后的结果.但显然cx和x的方向相同).而且x是特征向量的话.ax也是特征向量(a是标 量且不为零).所以所谓的特征向量不是一个向量而是一个向量族. 另外.特征值只不过反映了特征向量在变换时的伸缩倍数而已.对一个变换而言.特征向量指明的方向才是很重要的.特征值不是那么重要.虽然我们求这两个量时 先求出特征值.但特征向量才是更本质的东西!

比如平面上的一个变换.把一个向量关于横轴做镜像对称变换.即保持一个向量的横坐标不变.但纵坐标取相反数.把这个变换表示为矩阵就是[1 0,0 -1].其中分号表示换行.显然[1 0,0 -1]*[a b]'=[a -b]'.其中上标'表示取转置.这正是我们想要的效果.那么现在可以猜一下了.这个矩阵的特征向量是什么?想想什么向量在这个变换下保持方向不变.显 然.横轴上的向量在这个变换下保持方向不变(记住这个变换是镜像对称变换.那镜子表面上(横轴上)的向量当然不会变化).所以可以直接猜测其特征向量是 [a 0]'(a不为0).还有其他的吗?有.那就是纵轴上的向量.这时经过变换后.其方向反向.但仍在同一条轴上.所以也被认为是方向没有变化。
综上,特征值只不过反映了特征向量在变换时的伸缩倍数而已,对一个变换而言,特征向量指明的方向才是很重要的,特征值似乎不是那么重要;但是,当我们引用了Spectral theorem(谱定律)的时候,情况就不一样了。

Spectral theorem的核心内容如下:一个线性变换(用矩阵乘法表示)可表示为它的所有的特征向量的一个线性组合,其中的线性系数就是每一个向量对应的特征值,写成公式就是:

T(V)=λ1(V1.V)V1+λ2(V2.V)V2+λ3(V3.V)V3+...

从这里我们可以看出,一个变换(矩阵)可由它的所有特征向量完全表示,而每一个向量所对应的特征值,就代表了矩阵在这一向量上的贡献率——说的通俗一点就是能量(power),至此,特征值翻身做主人,彻底掌握了对特征向量的主动:你所能够代表这个矩阵的能量高低掌握在我手中,你还吊什么吊?

我们知道,一个变换可由一个矩阵乘法表示,那么一个空间坐标系也可视作一个矩阵,而这个坐标系就可由这个矩阵的所有特征向量表示,用图来表示的话,可以想象就是一个空间张开的各个坐标角度,这一组向量可以完全表示一个矩阵表示的空间的“特征”,而他们的特征值就表示了各个角度上的能量(可以想象成从各个角度上伸出的长短,越长的轴就越可以代表这个空间,它的“特征”就越强,或者说显性,而短轴自然就成了隐性特征),因此,通过特征向量/值可以完全描述某一几何空间这一特点,使得特征向量与特征值在几何(特别是空间几何)及其应用中得以发挥。

关于特征向量(特别是特征值)的应用实在是太多太多,近的比如俺曾经提到过的PCA方法,选取特征值最高的k个特征向量来表示一个矩阵,从而达到降维分析+特征显示的方法;近的比如Google公司的成名作PageRank,也是通过计算一个用矩阵表示的图(这个图代表了整个Web各个网页“节点”之间的关联)的特征向量来对每一个节点打“特征值”分;再比如很多人脸识别,数据流模式挖掘分析等方面,都有应用,有兴趣的兄弟可以参考IBM的Spiros在VLDB‘ 05,SIGMOD ’06上的几篇文章。

特征向量不仅在数学上,在物理,材料,力学等方面(应力、应变张量)都能一展拳脚,有老美曾在一本线代书里这样说过“有振动的地方就有特征值和特征向量”,确实令人肃然起敬+毛骨悚然......
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  人脸识别 ibm google web