RCNN的安装与简单使用
2015-09-08 17:33
393 查看
【原文:http://blog.csdn.net/kuaitoukid/article/details/46740477】
最近准备从物体检测的角度来重新审视文本检测这个方向,所以看了下CNN大火以后的几篇经典文献,OverFeat,Region CNN, Dense Neural Pattern等等。
对这个方向来说,百闻不如一试,趁着其他程序还在跑没什么事,我安装了一下RCNN来看看效果
RCNN的安装
下载与安装说明地址:https://github.com/rbgirshick/rcnn
其实我觉得安装并没有太多要说的,RCNN本身并没有很难安装,难点是caffe的安装,caffe安装好了剩下的就好说了
我就提一下我觉得两个要注意的点吧:
1. 这套代码是依赖于caffe的,在安装过程中也会说明,大家把安装说明中提到的caffe安装好就行了(里面有下载地址)
2. 假如说linux系统没有连接外网,需要自己手动下载Selective Search以及两个pretrain的model
Selective Search库的下载地址在selective_search文件夹下,运行sh文件看报错信息能知道,然后把下载的压缩包解压在selective_search文件夹就好
pre-train的model在data下面,运行sh文件看报错信息也能知道对应的下载地址,注意这两个model非常大,每个有1.5G,建议迅雷下载
RCNN的demo
额不得不说ssh协议下没法显示图像的确是蛋疼,最终我是在windows看了看结果,之后我会改改代码直接在图像上画框,而不是类似imshow这样的机制。不多说了,看结果吧
参考文献
Rich feature hierarchies for accurate object detection and semantic segmentation
OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks
Generic Object Detection with Dense Neural Patterns and Regionlets
Object Detection Networks on Convolutional Feature Maps
BoxSup: Exploiting Bounding Boxes to Supervise Convolutional Networks for Semantic Segmentation
AttentionNet: AggregatingWeak Directions for Accurate Object Detection
----------------------------------------------------分割线-----------------------------------------------------------
下面是我自己照的照片的识别结果
由于图片大小限制,只能给低分辨率的结果,高分辨率的结果会更准确而且召回率高
(竟然把红框里的当冰箱了,不过score并不高,也就是0.2左右)
最近准备从物体检测的角度来重新审视文本检测这个方向,所以看了下CNN大火以后的几篇经典文献,OverFeat,Region CNN, Dense Neural Pattern等等。
对这个方向来说,百闻不如一试,趁着其他程序还在跑没什么事,我安装了一下RCNN来看看效果
RCNN的安装
下载与安装说明地址:https://github.com/rbgirshick/rcnn
其实我觉得安装并没有太多要说的,RCNN本身并没有很难安装,难点是caffe的安装,caffe安装好了剩下的就好说了
我就提一下我觉得两个要注意的点吧:
1. 这套代码是依赖于caffe的,在安装过程中也会说明,大家把安装说明中提到的caffe安装好就行了(里面有下载地址)
2. 假如说linux系统没有连接外网,需要自己手动下载Selective Search以及两个pretrain的model
Selective Search库的下载地址在selective_search文件夹下,运行sh文件看报错信息能知道,然后把下载的压缩包解压在selective_search文件夹就好
pre-train的model在data下面,运行sh文件看报错信息也能知道对应的下载地址,注意这两个model非常大,每个有1.5G,建议迅雷下载
RCNN的demo
额不得不说ssh协议下没法显示图像的确是蛋疼,最终我是在windows看了看结果,之后我会改改代码直接在图像上画框,而不是类似imshow这样的机制。不多说了,看结果吧
参考文献
Rich feature hierarchies for accurate object detection and semantic segmentation
OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks
Generic Object Detection with Dense Neural Patterns and Regionlets
Object Detection Networks on Convolutional Feature Maps
BoxSup: Exploiting Bounding Boxes to Supervise Convolutional Networks for Semantic Segmentation
AttentionNet: AggregatingWeak Directions for Accurate Object Detection
----------------------------------------------------分割线-----------------------------------------------------------
下面是我自己照的照片的识别结果
由于图片大小限制,只能给低分辨率的结果,高分辨率的结果会更准确而且召回率高
(竟然把红框里的当冰箱了,不过score并不高,也就是0.2左右)
相关文章推荐
- java中方法重载和重写
- 确定public继承出来的是Is_a关系(Effective C++_32)
- poj 2763 Housewife Wind 边权的树链剖分
- iOS触摸事件学习
- RPC(Remote Procedure Call Protocol)
- 谷歌浏览器下小于12px字体的解决办法
- ApplicationContext
- Android中Context的理解与使用技巧
- mark 20150908
- Android客户端与服务器端通过DES加密认证
- Launcher 主菜单界面手机休眠后打开已经回到了待机界面
- leetcode--Find Minimum in Rotated Sorted Array II ---C++
- guibin
- php判断数据库是否连接成功的测试例子
- mongodb基本操作
- 微信公众号消息text换行问题
- 调试Crypt_GPG的过程
- log4j详解
- solr报maxClauseCount is set to 1024 的解决方案
- 11078 - Open Credit System(简单题)