论文笔记:Evaluation of local spatio-temporal features for action recognition
2017-06-08 20:26
543 查看
(2011年发表的文章)
文章通过对比实验对几种常用于行为识别的spatio-temporal 特征进行比较。所有对比实验在同一环境设置下进行。分别在KTH、UCF和Hollywood2这三种常用的行为识别数据集上,将不同的spatio-temporal特征提取器(Harris3D、Cuboids、Hessian、dense
sampling)和特征描述子(HOG3D、HOG/HOF、HOG、HOF、Cuboids、ESURF)进行组合然后进行对比实验。实验结果如下:
![](http://img.blog.csdn.net/20170608202752876)
最后得出结论:
1.密集采样(dense sampling)在大部分实验中比其他兴趣点提取器(Harris3D、Cuboids、Hessian)的性能要好。不过密集采样面临的一个问题是所提取的特征数量巨大,几乎是其他兴趣点提取器的15-20倍。兴趣点提取器的性能在不同数据集上各有千秋。
2.基于梯度的描述子和基于光流的描述子都是不错的描述子的选择。dense sampling和HOG/HOF描述子组合得到的特征在Hollywood2数据集上性能最好,而在UCF数据集上,HOG3D和dense sampling组合的性能最好。
文章很简短,也并没有什么可圈点的地方,不过确实可以为特征的选择提供一个不错的依据。感谢作者。
文章通过对比实验对几种常用于行为识别的spatio-temporal 特征进行比较。所有对比实验在同一环境设置下进行。分别在KTH、UCF和Hollywood2这三种常用的行为识别数据集上,将不同的spatio-temporal特征提取器(Harris3D、Cuboids、Hessian、dense
sampling)和特征描述子(HOG3D、HOG/HOF、HOG、HOF、Cuboids、ESURF)进行组合然后进行对比实验。实验结果如下:
最后得出结论:
1.密集采样(dense sampling)在大部分实验中比其他兴趣点提取器(Harris3D、Cuboids、Hessian)的性能要好。不过密集采样面临的一个问题是所提取的特征数量巨大,几乎是其他兴趣点提取器的15-20倍。兴趣点提取器的性能在不同数据集上各有千秋。
2.基于梯度的描述子和基于光流的描述子都是不错的描述子的选择。dense sampling和HOG/HOF描述子组合得到的特征在Hollywood2数据集上性能最好,而在UCF数据集上,HOG3D和dense sampling组合的性能最好。
文章很简短,也并没有什么可圈点的地方,不过确实可以为特征的选择提供一个不错的依据。感谢作者。
相关文章推荐
- Reading papers_16(Learning hierarchical invariant spatio-temporal features for action recognition wi
- 【论文笔记】Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition
- Reading papers_16(Learning hierarchical invariant spatio-temporal features for action recognition with independent subspace analysis)
- 双流网络行为识别-Spatiotemporal Residual Networks for Video Action Recognition-论文阅读
- 论文笔记-Temporal segment network:towards good practices for deep action recognition
- Learning hierarchical spatio-temporal features for action recognition with ISA
- [论文阅读笔记]Two-Stream Convolutional Networks for Action Recognition in Videos
- 论文阅读《Long-term Temporal Convolutions for Action Recognition》
- Bags of Local Convolutional Features for Scalable Instance Search 论文解读
- 论文笔记之:Let there be Color!: Joint End-to-end Learning of Global and Local Image Priors for Automatic
- 论文笔记之:Let there be Color!: Joint End-to-end Learning of Global and Local Image Priors for Automatic
- Cascaded Boundary Regression for Temporal Action Detection(tad)论文阅读笔记
- 论文阅读《Spatiotemporal Multiplier Networks for Video Action Recognition》
- [深度学习论文笔记][Video Classification] Learning Spatiotemporal Features with 3D Convolutional Networks
- [深度学习论文笔记][Scene Classification] Learning Deep Features for Scene Recognition using Places Database
- CV论文笔记(三)Convolutional-De-Convolutional Networks for Precise Temporal Action Localization in Untrimm
- 论文笔记:A Critical Review of Action Recognition Benchmarks
- 论文阅读笔记《leaning spatiotemporal features with 3D convolutional network》
- 《3D Convolutional Neural Networks for Human Action Recognition》论文阅读笔记
- Spatiotemporal Residual Networks for Video Action Recognition