您的位置：首页 > 其它

Spatial Transformer Layer 实验结果及分析

2016-07-20 10:34 302 查看

序言：

ST Layer在distorted minist数据集上表现出了很好的结果，但毕竟distorted minist是一个简单的数据集。（手写单个数字分类，所以共10类）

所以在本篇文章中，先会解释一部分，STLayer的原理，然后解释一部份minist上面的操作，最后解释一下我在market1501上的实验以及结果分析

解释：

ST Layer是一个由 6个参数和原图生成一个仿射变换后的新图。

这六个参数决定了仿射的方式。其实ST Layer的最终目的是让NN在看图像时具有attention（类似NLP中的应用，问答，其实最关键的只有某几个词）

（其实我自己也尝试用matconvnet，写过这个公式，以及相应的bp，但没收敛，速度上比较慢。但当时真的觉得自己可以写成功的，最后差了一点点。

因为matconvnet官方用cu写了一个，速度超快，我当时就服了。哈哈。）

matconvnet官方在distort minist采用的结构如下：

主要是先用了一个local网络预测6各参数，（图中下面一路）

用6个参数产生一个grid，应用在图像上，（图中下面一路和上面一路input集合在一起）

我在market1501上采用的结构如下：(清晰度很靠谱的，我调整过，建议下载然后放大看)

实验中：

1.在行人问题上是不是和预期的相同，学到背包或衣服

2.使用简单的欧氏距离，在test集上侧指标

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

Spatial Transformer Layer 实验结果 及 分析

Spatial Transformer Layer 实验结果及分析