您的位置:首页 > 其它

Spatial Transformer Layer 实验结果 及 分析

2016-07-20 10:34 302 查看
序言:

ST Layer在distorted minist数据集上表现出了很好的结果,但毕竟distorted minist是一个简单的数据集。(手写单个数字分类,所以共10类)

所以在本篇文章中,先会解释一部分,STLayer的原理,然后解释一部份minist上面的操作,最后解释一下我在market1501上的实验以及结果分析

解释:

ST Layer是一个 由 6个参数 和原图 生成一个 仿射变换后的新图。

这六个参数决定了仿射的方式。其实ST Layer的最终目的是让NN在看图像时具有attention(类似NLP中的应用,问答,其实最关键的只有某几个词)



(其实我自己也尝试用matconvnet,写过这个公式,以及相应的bp,但没收敛,速度上比较慢。但当时真的觉得自己可以写成功的,最后差了一点点。

因为matconvnet官方用cu写了一个,速度超快,我当时就服了。哈哈。)

matconvnet官方在distort minist采用的结构如下:



主要是先用了一个local网络预测6各参数,(图中下面一路)

用6个参数产生一个grid,应用在图像上,(图中下面一路和上面一路input集合在一起)

我在market1501上采用的结构如下:(清晰度很靠谱的,我调整过,建议下载然后放大看)



实验中:

1.在行人问题上是不是和预期的相同,学到背包或衣服

2.使用简单的欧氏距离,在test集上侧指标
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: