Spatial Transformer Layer 实验结果 及 分析
2016-07-20 10:34
302 查看
序言:
ST Layer在distorted minist数据集上表现出了很好的结果,但毕竟distorted minist是一个简单的数据集。(手写单个数字分类,所以共10类)
所以在本篇文章中,先会解释一部分,STLayer的原理,然后解释一部份minist上面的操作,最后解释一下我在market1501上的实验以及结果分析
解释:
ST Layer是一个 由 6个参数 和原图 生成一个 仿射变换后的新图。
这六个参数决定了仿射的方式。其实ST Layer的最终目的是让NN在看图像时具有attention(类似NLP中的应用,问答,其实最关键的只有某几个词)
(其实我自己也尝试用matconvnet,写过这个公式,以及相应的bp,但没收敛,速度上比较慢。但当时真的觉得自己可以写成功的,最后差了一点点。
因为matconvnet官方用cu写了一个,速度超快,我当时就服了。哈哈。)
matconvnet官方在distort minist采用的结构如下:
主要是先用了一个local网络预测6各参数,(图中下面一路)
用6个参数产生一个grid,应用在图像上,(图中下面一路和上面一路input集合在一起)
我在market1501上采用的结构如下:(清晰度很靠谱的,我调整过,建议下载然后放大看)
实验中:
1.在行人问题上是不是和预期的相同,学到背包或衣服
2.使用简单的欧氏距离,在test集上侧指标
ST Layer在distorted minist数据集上表现出了很好的结果,但毕竟distorted minist是一个简单的数据集。(手写单个数字分类,所以共10类)
所以在本篇文章中,先会解释一部分,STLayer的原理,然后解释一部份minist上面的操作,最后解释一下我在market1501上的实验以及结果分析
解释:
ST Layer是一个 由 6个参数 和原图 生成一个 仿射变换后的新图。
这六个参数决定了仿射的方式。其实ST Layer的最终目的是让NN在看图像时具有attention(类似NLP中的应用,问答,其实最关键的只有某几个词)
(其实我自己也尝试用matconvnet,写过这个公式,以及相应的bp,但没收敛,速度上比较慢。但当时真的觉得自己可以写成功的,最后差了一点点。
因为matconvnet官方用cu写了一个,速度超快,我当时就服了。哈哈。)
matconvnet官方在distort minist采用的结构如下:
主要是先用了一个local网络预测6各参数,(图中下面一路)
用6个参数产生一个grid,应用在图像上,(图中下面一路和上面一路input集合在一起)
我在market1501上采用的结构如下:(清晰度很靠谱的,我调整过,建议下载然后放大看)
实验中:
1.在行人问题上是不是和预期的相同,学到背包或衣服
2.使用简单的欧氏距离,在test集上侧指标
相关文章推荐
- 性能测试总结(二)---测试流程篇
- Android性能优化之常见的内存泄漏
- mong 备份和恢复
- 自定义控件其实很简单1/2
- 内存泄漏之内部类handler()
- android:padding和android:margin的区别
- 数据库常用操作
- ubuntu技巧备忘
- Ubuntu下resize图片以及查看大小命令
- C语言描述数据结构———封装DLL
- STM32F1学习-SysTick定时器
- textview动态设置 DrableLeft 以及改变图片大小
- ThinkPHP使用详解
- Codeforces Round #363 (Div. 2) B. One Bomb(思维题目)
- javaScript给元素添加多个class的简单实现
- Intent 传递的类型总结
- Hadoop参数汇总
- iOS开发之Masonry框架源码深度解析
- 性能测试总结(一)---基础理论篇
- hdu 5727 Necklace dfs+二分图匹配