您的位置：首页 > 其它

Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

2017-09-11 15:04 519 查看

时光荏苒，岁月如梭，恍惚间，一道白光闪现，空中一尊大佛低声喃语：小伙子，你，是不是太久没读论文了！于是，我开始补论文。简略记下，防止忘掉。

本文是deepmind出品，目的，就一个，放出个关于视频方面的训练集kinetics，一个四百个类，每个类有至少四百个clips，每个clips十秒钟，属于从youtube上剪切的视频，然后对比了几种现在存在的用于行为识别的几种框架，具体如下图：

其中，a，b，c，d是现有的做法，作者提出了e，唉，这种框架，感觉有点和前面没啥区别。然后，神奇的事情出现了：这个数据集上训练的模型，通过迁移学习到UCF101和HMDB51上，准确率惊人。

具体的网络：

做了如下几个事情：

第一：卷积核和pooling的核由二维扩展到三维。

第二：大的数据视频数据集上训练。

第三：迁移到UCF101，HMDB51，识别结果好。

实验结果：

是不是很惊喜，是不是，是不是，你收集的数据集，当然你说了算。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航