Beyond sliding windows-Object Localizationby Efficient Subwindow Search论文阅读
2017-08-13 10:51
573 查看
这段时间我主要完成了:
一、《Selective Search for Object Recognition》(重点学习):
1、对代码每一步,甚至每一个变量含义都看懂。
2、修改源代码,使其能够在自己建立的环境下运行。
3、对代码进行单步调试,对照论文中介绍的算法再次加深理解。
4、获得实验结果。
二、bag of visual words视觉词袋模型:
1、了解Bovw模型含义,和使用过程。
2、通过C语言简单实现bovw模型。
三、《Beyond sliding windows-Object Localizationby Efficient Subwindow Search》英文论文原文阅读(重点学习):
1、阅读英文原文。
2、将英文原文简单翻译,加深理解论文内容。
四、《Efficient Subwindow Search》C++实现(重点学习):
1、对代码每一步,甚至每一个变量含义着重理解,看懂为止。
2、对每一步进行注释,使其能够在自己搭建的环境下(OpenCV3.2+VS2015)运行。
3、对程序进行单步调试,理解程序运行的每一步,加深理解论文中介绍的算法。
4、获得实验结果。
这段时间里,先是拿出大量的时间阅读英文论文,第一次看有关专业方面的英文文献,所以我非常认真,把文章中每一个单词都查了一遍,看不懂的句子反复阅读,结合上下午直到看懂。《Beyond sliding windows-Object Localizationby Efficient Subwindow Search》这篇论文中的第二部分Efficient Subwindow Search(ESS)和第三部分Application Ⅰ:Localization
of non-rigid objects using a bag ofvisual words kernel至少看了六七遍才逐渐摸清思路。之后我感觉但看论文理解其中的算法还是不足够的。并进行简单修改后适应自己电脑上的开发环境,可以运行之后单步调试,在此期间继续阅读论文中介绍的原理部分。通过单步调试理论和代码实践结合理解,这最终才算是看懂了一些。
对于这两篇论文《Selective Search for Object Recognition》和《Beyond sliding windows-Object Localizationby Efficient Subwindow Search》都介绍的是物体识别,定位算法:
Selective Search算法我理解的是将图像分割(使用Graph-Based Image Segmentation图像分割)成很多小区域,通过区域之间的相似度进行合并,获得最可能的候选区域。然后每个区域进行判别,也就是判别每个区域到底是"牛"还是"非牛"。
Efficient Subwindow Search算法我的理解是将问题的解空间用[T,B,L,R](对应矩形的上下左右4条轴)4 个区间来表示(初始为整个图像),每次选取最长的一个区间分割,并计算解空间的上边界quality bounding function(空间内最大矩形的正值和 + 空间内最小矩形的负值和),并以此进行优先搜索,在这个算法中利用到上边界优先队列,上边界值最大的矩形集合即为最有前景的区域。
这两个算法的差别我认为是Selective Search是先分割后逐渐合并找到目标定位,Efficient Subwindow Search是主键分割最有前景的的矩形集合[T,B,L,R]直到不可分割为止找到目标定位。
至此暑假任务基本完成,剩余的暑假中我准备利用暑期所学的知识(特征检测和匹配,目标识别定位)再次回顾,试着使用opencv自己做一些小程序。
Efficient Subwindow Search算法结果
![](https://img-blog.csdn.net/20170813111318698?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvcXFfMTY3NjE1OTk=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
Efficient Subwindow Search算法
![](https://img-blog.csdn.net/20170813111325405?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvcXFfMTY3NjE1OTk=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20170813111330738?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvcXFfMTY3NjE1OTk=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
Efficient Graph-Based Image Segmentation算法
![](https://img-blog.csdn.net/20170813111305915?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvcXFfMTY3NjE1OTk=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
Selective Search算法
![](https://img-blog.csdn.net/20170813111312668?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvcXFfMTY3NjE1OTk=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
附加代码连接和论文翻译
一、《Selective Search for Object Recognition》(重点学习):
1、对代码每一步,甚至每一个变量含义都看懂。
2、修改源代码,使其能够在自己建立的环境下运行。
3、对代码进行单步调试,对照论文中介绍的算法再次加深理解。
4、获得实验结果。
二、bag of visual words视觉词袋模型:
1、了解Bovw模型含义,和使用过程。
2、通过C语言简单实现bovw模型。
三、《Beyond sliding windows-Object Localizationby Efficient Subwindow Search》英文论文原文阅读(重点学习):
1、阅读英文原文。
2、将英文原文简单翻译,加深理解论文内容。
四、《Efficient Subwindow Search》C++实现(重点学习):
1、对代码每一步,甚至每一个变量含义着重理解,看懂为止。
2、对每一步进行注释,使其能够在自己搭建的环境下(OpenCV3.2+VS2015)运行。
3、对程序进行单步调试,理解程序运行的每一步,加深理解论文中介绍的算法。
4、获得实验结果。
这段时间里,先是拿出大量的时间阅读英文论文,第一次看有关专业方面的英文文献,所以我非常认真,把文章中每一个单词都查了一遍,看不懂的句子反复阅读,结合上下午直到看懂。《Beyond sliding windows-Object Localizationby Efficient Subwindow Search》这篇论文中的第二部分Efficient Subwindow Search(ESS)和第三部分Application Ⅰ:Localization
of non-rigid objects using a bag ofvisual words kernel至少看了六七遍才逐渐摸清思路。之后我感觉但看论文理解其中的算法还是不足够的。并进行简单修改后适应自己电脑上的开发环境,可以运行之后单步调试,在此期间继续阅读论文中介绍的原理部分。通过单步调试理论和代码实践结合理解,这最终才算是看懂了一些。
对于这两篇论文《Selective Search for Object Recognition》和《Beyond sliding windows-Object Localizationby Efficient Subwindow Search》都介绍的是物体识别,定位算法:
Selective Search算法我理解的是将图像分割(使用Graph-Based Image Segmentation图像分割)成很多小区域,通过区域之间的相似度进行合并,获得最可能的候选区域。然后每个区域进行判别,也就是判别每个区域到底是"牛"还是"非牛"。
Efficient Subwindow Search算法我的理解是将问题的解空间用[T,B,L,R](对应矩形的上下左右4条轴)4 个区间来表示(初始为整个图像),每次选取最长的一个区间分割,并计算解空间的上边界quality bounding function(空间内最大矩形的正值和 + 空间内最小矩形的负值和),并以此进行优先搜索,在这个算法中利用到上边界优先队列,上边界值最大的矩形集合即为最有前景的区域。
这两个算法的差别我认为是Selective Search是先分割后逐渐合并找到目标定位,Efficient Subwindow Search是主键分割最有前景的的矩形集合[T,B,L,R]直到不可分割为止找到目标定位。
至此暑假任务基本完成,剩余的暑假中我准备利用暑期所学的知识(特征检测和匹配,目标识别定位)再次回顾,试着使用opencv自己做一些小程序。
Efficient Subwindow Search算法结果
Efficient Subwindow Search算法
Efficient Graph-Based Image Segmentation算法
Selective Search算法
附加代码连接和论文翻译
Object localization by efficient subwindow search论文中文翻译附加知识点提炼
Selective Search for Object Recognition算法详解
Efficient Graph-Based Image Segmentation
Efficient Subwindow Search算法代码精析
相关文章推荐
- xjc-beyond sliding windows-Object Localization by Efficient Subwindow Search 论文的算法和知识点
- xjc-beyond sliding windows-Object Localization by Efficient Subwindow Search
- 高效子窗口检测定位(Object Localization by Efficient Subwindow Search)
- 论文阅读(Lukas Neuman——【ICDAR2015】Efficient Scene Text Localization and Recognition with Local Character Refinement)
- 【论文阅读笔记】Segmentation as Selective Search for Object Recognition
- 文本检测论文阅读-Object Proposals for Text Extraction in the WildSelective Search for Object Recoginition。
- 【CV论文阅读】+【搬运工】LocNet: Improving Localization Accuracy for Object Detection + A Theoretical analysis of feature pooling in Visual Recognition
- 论文阅读Soft Proposal Networks for weekly-supervised object localization
- 关于Efficient Subwindow Search 的小测试
- 论文阅读笔记--Selective Search for Object Recognition
- 【计算机视觉】Selective Search for Object Recognition论文阅读2
- 【计算机视觉】Selective Search for Object Recognition论文阅读3
- 论文阅读-LightGBM: A Highly Efficient Gradient Boosting Decision Tree
- Clustering by fast search and find of density peaks 论文中文翻译及matlab实现
- Object Detection:R-CNN、Fast R-CNN、Faster R-CNN论文阅读笔记
- 论文阅读《DeNet: Scalable Real-time Object Detection with Directed Sparse Sampling》
- cuDNN: efficient Primitives for Deep Learning 论文阅读笔记
- [论文阅读]R-FCN: Object Detection via Region-based Fully Convolutional Networks
- 【论文阅读笔记】Rocket Launching: A Universal and Efficient Framework for Training Well-performing Light Net
- 论文阅读:Instance-Level Salient Object Segmentation