您的位置：首页 > 其它

阅读笔记1：fast tracking via spatio-temporal context learning

2016-05-23 22:50 531 查看

本文是香港理工大学Kuaihua Zhang的一篇跟踪文章，发表在2014ECCV上，其突出贡献就是快，达到了350fps。传统的跟踪算法大多是利用时序信息即图像的前后帧的位置信息做预测，而本文则是融合目标的空间的信息，例如，跟踪过程中目标的背景信息是缓慢发生变化的，目标在背景中的空间位置与空间信息有很大关联，这就是文章中最大的创新点。其利用目标特征非常之简单（intensity and location of each pixel in proposal region），这也是速度之所以快的一个主要原因吧，下面对文章的主要内容做一下梳理，有不足之处希望得到大家的指点。

主要流程：

step1：根据第一帧的标注信息，构建空间上下文模型（spatio context model）；

step2：用步骤1中的空间纹理模型更新下一帧的空间时序模型（spatio-temporal context model；

step3：用步骤2构建的空间时序上下文模型计算目标置信图，其中最大值即为本帧的目标位置。

step4：步骤3生成的confidence map用于计算一个目标尺度更新策略。

一，跟踪建模

本文把跟踪问题建模问计算目标位置置信图object location confidence map，该置信图是有目标空间位置的似然函数计算所得，

x 表示目标位置，o表示含有跟踪目标的场景

进一步分解该问题：

c(z)是o中的点z得上下文特征空间 c(z) = (I (z), z)，主要包含空间灰度特征和空间位置特征。X^c表示o中c(z)的特征集。这样就把问题转化为了P(x|c(z),o)和P(c(z)|o)的条件概率乘积之和，下面主要建模的就是P(x|c(z),o)即目标位置关于空间上下文特征的条件概率。

1.1；空间上下文对目标位置建模：编码了空间上下文信息与目标位置之间的关系