您的位置:首页 > 其它

Faster RCNN简单总结

2017-08-09 14:16 183 查看


图片地址:http://blog.csdn.net/zy1034092330/article/details/62044941

RPN

1.RPN和Fast RCNN是提前训练好的,之后再微调的结果;

2.每次走到RPN的时候anchor数目(anchor是在原图上的)是相同的,所以物体分类和BBOX的输入时相同的输入anchor。

①物体分类检测是根据anchor来判断是否为物体(正类),但是整理的框通常不够好,所以还需要计算BBOX的变换。

②BBOX是由anchor的坐标回归计算得到偏移参数,可以理解为:修正目标=anchor坐标*W,我们就是要求出W。

注意:RPN都是基于原图像的。

Proposal Layer

将得到的W用到①中的正类进行anchor的位置修正;

检查anchor在原图像上是否越界,越界就删除;

进行nms;

选出前300个候选框。

RoI pooling

将RPN选中的300个候选框(原图上修正后的anchor),通过spatial_scale: 1/16 映射到feature map上,在通过pooled_w: 7和pooled_h: 7将每个候选框49个,取每个对应的maxpooling值,这样得到49个全连接层的输入。

再往后就是分类器和BBox的再次精修操作(Fast RCNN的操作)。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息