您的位置：首页 > Web前端

论文笔记 Hierarchical Convolutional Features for Visual Tracking

2016-09-05 22:41 477 查看

同样是ICCV 2015的文章，并且与上一篇介绍的FCNT方法不谋而合，都提到了VGG网络不同卷积层提取到的特征类型的不同。

理论基础：

低层网络包含更高空间分辨率的低维视觉信息，可以用于精确的定位，类似于Gabor滤波器；而高层网络获取到更多语义类别信息，相对空间信息少。本文利用高层的语义信息来处理目标外形的变化问题，同时用低层信息进行精准定位。

想法结构：

算法结构：

（1）首先利用第一帧已知的目标位置区域，得到其对应的Conv3_4,Conv4_4,Conv5_4目标位置的特征，训练得到3个相关的滤波器

（2）之后的第t帧，以t-1帧的预测结果为中心，获得该位置在Conv3_4,Conv4_4,Conv5_4的特征，将特征做插值并通过3个相关滤波器预测出二维的置信分数

（3）从Conv5_4层的滤波器结果开始，算出confidence
score上最大的响应点，作为第t帧时候预测的位置，之后以这个位置约束下一层的搜索范围，逐层向下做更细粒度的位置预测，以最低层的预测结果作为最后输出

（4）利用当前跟踪结果反向对每层的相关滤波器进行更新

实验结果：

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： Deep Learning cnn tracking

相关文章推荐

新的分享

章节导航