您的位置：首页 > 其它

深度学习在人脸识别领域的应用（2）

2013-08-22 17:39 405 查看

         Deep Convolutional Network Cascade for Facial Point Detection

       本文是CVPR2013汤晓欧课题组的最新工作，利用级联深度卷积网络进行面部特征点定位。

1. Deep Covolutional Network

        Deep Covolutional Network深度卷积神经网络，正是我们所熟悉的CNN（Covolutioanl neural network），CNN在上了世纪末年就已经成型[1]，现如今深度学习如日中天，加个Deep顿时就高端起来了

。

Figure.1 给出了Deep CNN的结构图，Deep CNN通过多层的卷积结构来提取层次特征(Hierarchical Feature)，并通过max-pooling层下采样获取不变性，最后通过最上层一个全连接的MLP(hidden layer + logistic regression)[2]来实现分类。

2. Cascaded Convolutional Network

          图2是整个系统的结构图，“Cascaded"就体现在这样的一个层次结构上，F1、EN1和NM1首先是一层粗的定位，后面再通过更加精细LE21等第二层检测器以及LE31等第三层检测器实现更为精细的位置修正。图中的黄色区域是每层检测器的扫描区域。注意第一层卷积网络的标识为Deep CNN，这表示第一层网络所采用的是Figure.1所示的深度结构。注意，LE21和LE22都是用来预测左眼中心的位置，区别在于扫描区域。

3. 实现细节

     Level 1-3的网络结构见下表：

      注意Level2-3所采用的网络结构均为S2。

      下表则给出了的Level 2-3各个卷积网络的扫描区域。

       从Table2可以清晰的看出LE21和LE22在扫描区域上的区别。
4. 实验

     Figure.4比较了多种网络结构，Figure.5显示了多层级联结构的优势。：

       Figure.6 在BioID和LFPW两个库上将本文方法与state-of-the-art方法进行了比较。可见本文方法的性能相比传统方法有较大提升（50% Accuracy improvement）。

      Figure.8给出了一些检测结果，本文作者用C++实现了该方法，检测速度为0.12second/per image，相当于8frames/s，客观的说，这个速度不算快，但是检测精度的确非常给力。

参考文献

[1]
LeNet-5

[2] Multilayer
Perceptron

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航