您的位置：首页 > 理论基础 > 计算机网络

Coursea吴恩达《卷积神经网络》课程笔记(2)深度卷积网络

2017-11-14 16:06 363 查看

经典的卷积神经网络架构

LeNet-5

AlexNet

VGG

ResNet

Inception(Google Network)

残差网络

残差网络是由残差块组成

1 残差网络块

z[l+1]=W[l+1]a[l]+b[l+1]

a[l+1]=g(z[l+1])

z[l+2]=W[l+2]a[l+1]+b[l+2]

a[l+2]=g(z[l+1]+a[l])

2 残差网络的优势

可以防止梯度消失和梯度爆炸

恒等映射增加了网络的性能,普通网络

3 残差网络表现好的原因

假设有个比较大的神经网络，输入为x，输出为a[l]。如果我们想增加网络的深度，这里再给网络增加一个残差块：

假设网络中均使用Relu激活函数，所以最后的输出a⩾0。这里我们给出a[l+2]的值：

a[l+2]=g(z[l+1]+a[l])=g(W[l+2]a[l+1]+b[l+2]+a[l])

如果使用L2正则化或者权重衰减，会压缩W和b的值，如果W[l+2]=0同时b[l+2]=0，那么上式就变成：

a[l+2]=g(a[l])=relu(a[l])=a[l]

所以从上面的结果我们可以看出，对于残差块来学习上面这个恒等函数是很容易的。所以在增加了残差块后更深的网络的性能也并不逊色于没有增加残差块简单的网络。所以尽管增加了网络的深度，但是并不会影响网络的性能。同时如果增加的网络结构能够学习到一些有用的信息，那么就会提升网络的性能。