您的位置:首页 > 编程语言

几个视频中行为识别的底层特征及代码

2016-01-25 13:54 691 查看
1. 比较出名的是Ivan Laptev的 3D Harris,这是一个可执行文件,用起来比较方便,是Harris在3维空间的扩展,检测到特征点之后是用HOG和HOF进行表示。一共的特征维数是162维。点击这里进入下载界面。





2. P. Dollar的cuboids角点检测,方法大致是用1D的gabor进行滤波。检测到角点之后,作者的实验表明直接用cuboids里面的梯度作为表示,然后再进行降维。我认为这个方法的缺点是降维之前的维数太高,求协方差矩阵特征值所花费的时间比较多(一般降维前的特征都是上万维的)。但是这个算法的一个好处是可以控制每个视频提特征点的个数。所以现在这个特征用的人是最多的。代码需要给作者发邮件获取。





3. Alexander Klaser的3D HOG不需要进行特征点检测,是对视频进行稠密采样,提取3D HOG特征。点击这里下载。这种稠密采样的特征在UCF Sports这个数据库上面的效果很好。





4. Paul Scovanner 的3D SIFT,同样也是将图像中很火的SIFT扩展到3维情况。但是这个特征用的人相对较少。

点击这里下载。

本文转自:http://blog.sina.com.cn/s/blog_631a4cc40100zi2p.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: