您的位置:首页 > 理论基础 > 计算机网络

Learning Deconvolution Network for Semantic Segmentation

2016-07-13 14:23 316 查看
原创文章,引用请注明出处:http://blog.csdn.net/tonyyang1995 谢谢!

最近在读深度学习中深度学习的论文,老板要写总结所以顺便发上来记录一下。

Learning Deconvolution Network for Semantic Segmentation 这篇论文主要优化的是传统反卷积网络的一些limitation。

传统FCN 存在的limitation:

1. 它的network pre-defined a fixed size receptive field(这个会导致比这个field 大或者小的object会fragment 或 mislabel,而且比较小的物体可能会被忽略或者被分类成背景)



2. 物体的具体结构可能会消失 因为输入的label map 比较粗糙而且deconvolution 的操作比较简单



所以即使已经使用了CRF 但是效果还是不太好。

为了解决这些问题:

作者提出了一个深度的反卷积网络。

这个网络由多个deconvolution,unpooling,relu组成。

训练的network 是应用于单独的object proposal 来获得instance-wise 分割

在VOC12 的数据集上的表现比其他的FCN-based method 要好。

它的结构图如下:



从这个图我们可以看出它的convolution 和deconvolution 是镜像的。

这里作者使用了unpooling 操作顾名思义就是把polling的操作反过来,但是因为pooling的操作不可逆,这个unpooling操作只能把传进来的特征按照原来的位置重新摆放,近似pooling 前的卷积特征。



deconvolution



这里parameter 是可以学习的。

在论文中,作者对于deep deconvolution network 的分析后发现: 越complex 的能够capture更多的细节。



从上图中我们可以发现越深的Deconvolution network 更加能够把握原图的细节信息。

而与FCN8 对比之后也证明了这一点:



而对于deep network 中local optima 的问题,作者提出了

1. batch normalization

2. two-stage training

这两个方法来解决。(这里现在仅仅知道这样有效,还不能理解为什么这样就有效,所以仅列出其方法,求大神讲解)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  网络 深度学习 优化