您的位置：首页 > 其它

风险风险之深入分析协方差意义与算法

2014-10-21 13:13 232 查看

协方差（Covariance），是在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况，即当两个变量是相同的情况。协方差分析是建立在方差分析和回归分析基础之上的一种统计分析方法。协方差是建立在方差分析与回归分析的基础之上的一种统计分析方法，好官方的解释，不太好理解。下面我们有通用的方式来解释。

我们先回忆一下期望、方差与标准查的应用。期望（均值）描述的是样本集合的中间点，它告诉我们的信息是很有限的，而标准差给我们描述的则是样本集合的各个样本点到均值的距离之平均。以这两个集合为例，[0，8，12，20]和[8，9，11，12]，两个集合的均值都是10，但显然两个集合差别是很大的，计算两者的标准差，前者是8.3，后者是1.8，显然后者较为集中，故其标准差小一些，标准差描述的就是这种“散布度”。

我们注意到，标准差和方差是用来描述一维数据的，但现实生活我们常常遇到含有多维数据的数据集，比如统计某次考试中100个学生5科考试成绩。面对这样的数据集，我们计算出每一个学生的成绩的方差，但是我们不能知道多个学生之间的成绩之间的关系，此时，协方差就是用来度量两个随机变量关系的统计量，即两个不同参数之间的。

协方差的结果有什么意义呢？如果结果为正值，则说明两者是正相关的(从协方差可以引出“相关系数”的定义)，结果为负值就说明负相关的，如果为0，也是就是统计上说的“相互独立”。

当协方差多了后，我们可以构建成协方差矩阵，但是协方差矩阵，计算的样本集中不同纬度之间的协方差，而不是不同样本之间的协方差。比如100个学生的5科的成绩，构成的矩阵，为5*100的矩阵，得到的是每个学生之间的关系。

我们进一步分析一下协方差相关的公式

协方差定义：