深度学习在人脸识别领域的应用(2)
2013-08-22 17:39
405 查看
Deep Convolutional Network Cascade for Facial Point Detection
本文是CVPR2013汤晓欧课题组的最新工作,利用级联深度卷积网络进行面部特征点定位。
1. Deep Covolutional Network
Deep Covolutional Network深度卷积神经网络,正是我们所熟悉的CNN(Covolutioanl neural network),CNN在上了世纪末年就已经成型[1],现如今深度学习如日中天,加个Deep顿时就高端起来了
![](http://static.blog.csdn.net/xheditor/xheditor_emot/default/laugh.gif)
。
![](https://img-blog.csdn.net/20130822164908140?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdmlzaW9uaGFjaw==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
Figure.1 给出了Deep CNN的结构图,Deep CNN通过多层的卷积结构来提取层次特征(Hierarchical Feature),并通过max-pooling层下采样获取不变性,最后通过最上层一个全连接的MLP(hidden layer + logistic regression)[2]来实现分类。
2. Cascaded Convolutional Network
![](https://img-blog.csdn.net/20130822164215093?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdmlzaW9uaGFjaw==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
图2是整个系统的结构图,“Cascaded"就体现在这样的一个层次结构上,F1、EN1和NM1首先是一层粗的定位,后面再通过更加精细LE21等第二层检测器以及LE31等第三层检测器实现更为精细的位置修正。图中的黄色区域是每层检测器的扫描区域。注意第一层卷积网络的标识为Deep CNN,这表示第一层网络所采用的是Figure.1所示的深度结构。注意,LE21和LE22都是用来预测左眼中心的位置,区别在于扫描区域。
3. 实现细节
Level 1-3的网络结构见下表:
![](https://img-blog.csdn.net/20130822172256578?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdmlzaW9uaGFjaw==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
注意Level2-3所采用的网络结构均为S2。
下表则给出了的Level 2-3各个卷积网络的扫描区域。
![](https://img-blog.csdn.net/20130822172709953?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdmlzaW9uaGFjaw==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
从Table2可以清晰的看出LE21和LE22在扫描区域上的区别。
4. 实验
Figure.4比较了多种网络结构,Figure.5显示了多层级联结构的优势。:
![](https://img-blog.csdn.net/20130822172815671?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdmlzaW9uaGFjaw==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
![](https://img-blog.csdn.net/20130822173325156?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdmlzaW9uaGFjaw==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
Figure.6 在BioID和LFPW两个库上将本文方法与state-of-the-art方法进行了比较。可见本文方法的性能相比传统方法有较大提升(50% Accuracy improvement)。
Figure.8给出了一些检测结果,本文作者用C++实现了该方法,检测速度为0.12second/per image,相当于8frames/s,客观的说,这个速度不算快,但是检测精度的确非常给力。
![](https://img-blog.csdn.net/20130822173719656?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdmlzaW9uaGFjaw==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
参考文献
[1]
LeNet-5
[2] Multilayer
Perceptron
本文是CVPR2013汤晓欧课题组的最新工作,利用级联深度卷积网络进行面部特征点定位。
1. Deep Covolutional Network
Deep Covolutional Network深度卷积神经网络,正是我们所熟悉的CNN(Covolutioanl neural network),CNN在上了世纪末年就已经成型[1],现如今深度学习如日中天,加个Deep顿时就高端起来了
![](http://static.blog.csdn.net/xheditor/xheditor_emot/default/laugh.gif)
。
Figure.1 给出了Deep CNN的结构图,Deep CNN通过多层的卷积结构来提取层次特征(Hierarchical Feature),并通过max-pooling层下采样获取不变性,最后通过最上层一个全连接的MLP(hidden layer + logistic regression)[2]来实现分类。
2. Cascaded Convolutional Network
图2是整个系统的结构图,“Cascaded"就体现在这样的一个层次结构上,F1、EN1和NM1首先是一层粗的定位,后面再通过更加精细LE21等第二层检测器以及LE31等第三层检测器实现更为精细的位置修正。图中的黄色区域是每层检测器的扫描区域。注意第一层卷积网络的标识为Deep CNN,这表示第一层网络所采用的是Figure.1所示的深度结构。注意,LE21和LE22都是用来预测左眼中心的位置,区别在于扫描区域。
3. 实现细节
Level 1-3的网络结构见下表:
注意Level2-3所采用的网络结构均为S2。
下表则给出了的Level 2-3各个卷积网络的扫描区域。
从Table2可以清晰的看出LE21和LE22在扫描区域上的区别。
4. 实验
Figure.4比较了多种网络结构,Figure.5显示了多层级联结构的优势。:
Figure.6 在BioID和LFPW两个库上将本文方法与state-of-the-art方法进行了比较。可见本文方法的性能相比传统方法有较大提升(50% Accuracy improvement)。
Figure.8给出了一些检测结果,本文作者用C++实现了该方法,检测速度为0.12second/per image,相当于8frames/s,客观的说,这个速度不算快,但是检测精度的确非常给力。
参考文献
[1]
LeNet-5
[2] Multilayer
Perceptron
相关文章推荐
- 深度学习在人脸识别领域的应用(4)
- 深度学习在人脸识别领域的应用
- 深度学习在人脸识别领域的应用
- 深度学习在人脸识别领域的应用(1)
- 深度学习在人脸识别领域的应用(3)
- 深度学习在推荐领域的应用
- 深度学习在搜索和推荐领域的应用
- 北大 AI 公开课第9讲:滴滴研究院副院长叶杰平——深度学习在交通领域应用潜力巨大
- 【总结】深度学习在推荐领域的应用
- 微软邓力:深度强化学习在聊天机器人领域的应用
- 深度学习在推荐领域的应用 Lookalike Facebook node2vec 深度学习 推荐领域
- 漫谈深度学习在Super Resolution(超分辨率)领域上的应用
- 深度学习在推荐领域的应用
- 【AI in 美团】深度学习在文本领域的应用
- 深度学习在推荐领域的应用
- 领域应用 | 深度学习在知识图谱构建中的应用
- 技术文章 | 深度学习在推荐领域的应用:Lookalike 算法
- 深度学习在推荐领域的应用
- 深度学习在健康医疗领域的应用综述
- 关于深度学习在生物学领域的应用分析