您的位置：首页 > 其它

运动目标跟踪（八）--时空上下文(STC)跟踪原理

2016-08-16 09:36 483 查看

从原理可以看出，STC在相机运动环境中，效果不会太好，尤其是在高速运动环境下。因为高速运动环境，背景几乎与前景一起运动，这与其核心原理是违背的，其次，时间上下文关系，也是低速环境下的经验值，实际会出现跟不上的问题（完全与时间上下文相关的参数有关）。

其优点在于固定背景下，遮挡问题的鲁棒性。

一.前言

《Fast Tracking via Spatio-Temporal Context Learning》是Kaihua Zhang等人发表的一篇文章，文中提到了通过利用时空上下文进行视觉跟踪，具有很好的实时性和鲁棒性。该算法基于贝叶斯框架，建立了我们感兴趣的目标与周围内容的时空关系，在低阶特征上(如图像灰度和位置)对目标与附近区域进行了统计关系建模。通过计算置信图（confidence
map），找到似然概率最大的位置，即为跟踪结果。

算法的计算过程主要是利用了傅立叶快速变换，目前作者已经提供了matlab源代码，该代码在i7机器上运行速度可以达到350FPS,速度效果着实明显！同时，在博客 http://blog.csdn.net/zouxy09/article/details/16889905 上，博主给出了他写出的单尺度c＋＋版STC代码。在本篇博客的最后，我也对代码进行了整理，完善，代码中有什么不足的地方，希望大家能够积极指正。

代码下载地址：http://download.csdn.net/detail/qianxin_dh/7882289

本论文官方主页：http://www4.comp.polyu.edu.hk/~cslzhang/STC/STC.htm

二.走进STC

视觉跟踪领域中，由我们感兴趣的目标物体与它附近一定区域范围内的背景共同组成局部上下文(见下图红色框）。因此，局部上下文在连续帧中存在着很强的时空关系。例如，图中女生的脸部发生了明显的遮挡现象，但是对于局部区域来说，只是一部分发生了变化，背景以及遮挡部分与背景之间的相对位置并未发生明显改变，利用这一点，局部上下文就可以在下一帧帮助预测到目标出现的位置。

通常来说，时间上下文帮助我们目标位置，而空间上下文则能提供更精确的信息帮助我们区分目标和背景。利用时空上下文可以实现快速，鲁棒的跟踪物体，其基本的算法流程如下：
1）基于目标与它局部区域内背景的空间关系建立一个空间上下文模型。
2）利用空间上下文模型对下一帧的时空上下文模型进行更新。
结合时空上下文信息，对图像进行卷积操作，获得置信图，并求得它的最大似然概率位置作为最佳目标位置。

三.具体公式

上面一部分提到了要获得目标的跟踪位置，我们需要获得当前帧的置信图。论文中给出了置信图的公式：

x表示目标位置，o表示目标出现。假定当前帧中，我们已经知道了目标位置为X*,则从图像中我们可以获得特征：

，I(z)表示位置z处的图像灰度，

表示目标X*的局部区域。

上述公式中，我们可以看到C(x)分成了两部分相乘，其中条件概率P(x|c(z),o)对目标和它的上下文信息进行了空间关系建模，这也是整个算法过程中的主要环节。而上下文先验概率P(c(z)|o)对局部上下文信息进行了建模(见上图),也即是，局部区域内每个点z为目标的概率。

以下就公式中具体的每个环节进行分析，结合整体流程更利于理解该算法，首先，先列出算法的整体运行流程：