多任务学习“Facial Landmark Detection by Deep Multi-task Learning”
2017-10-26 11:40
417 查看
使用多任务学习提升人脸特征点检测的准确率,相关的任务如人头姿态估计、人脸属性预测(性别、年龄、人脸表情)。考虑到不同任务的收敛速度不一样,有些任务可以提前停止优化。
人类特征点检测的估计受其他任务或相关因素的影响。如人笑的时候嘴是大张的,头部偏转角度大时,瞳孔距离变小,挖掘这些人脸属性相关的信息可以帮助检特征点。示例 如图1所示:
不同的任务学习的难度比较大,如分辨“戴眼镜”就比分辨是否“笑”要简单,不同的任务收敛速率不同,如果同步收敛,这些任务很可能过拟合。论文提出了TCDCNC,每个任务可在不同迭代步骤收敛。
TCDCN
多任务学习的目标一般是:
与传统多任务学习不同,论文的目的在辅助任务的帮助下,优化主要任务r,即人脸特征点检测,问题描述为:
其中λa表示任务a的重要性因子。(2)中不同的损失函数可以一起优化,且共享输入层。
TCDCN的结构
训练刚开始时,TCDCN被所有任务约束,训练过程中,辅助任务对主任务不再有益。用Eaval和Eatr表示任务a在训练和验证集上的损失函数,任务a将在任务的测量值超过阈值ϵ时停止:
公式(5)中第一项代表训练误差,如果训练误差下降很快,第一项的值较小,表示训练可以继续,否则任务可以停止;第二项表示泛化误差。训练过程中使用SGD更新任务和滤波器的权值。对于浅层的滤波器,通过BP的loss误差计算梯度。浅层的误差如下计算:
实验结果
不同任务的收敛速率
自身不同方法的比较:
人类特征点检测的估计受其他任务或相关因素的影响。如人笑的时候嘴是大张的,头部偏转角度大时,瞳孔距离变小,挖掘这些人脸属性相关的信息可以帮助检特征点。示例 如图1所示:
不同的任务学习的难度比较大,如分辨“戴眼镜”就比分辨是否“笑”要简单,不同的任务收敛速率不同,如果同步收敛,这些任务很可能过拟合。论文提出了TCDCNC,每个任务可在不同迭代步骤收敛。
TCDCN
多任务学习的目标一般是:
与传统多任务学习不同,论文的目的在辅助任务的帮助下,优化主要任务r,即人脸特征点检测,问题描述为:
其中λa表示任务a的重要性因子。(2)中不同的损失函数可以一起优化,且共享输入层。
TCDCN的结构
训练刚开始时,TCDCN被所有任务约束,训练过程中,辅助任务对主任务不再有益。用Eaval和Eatr表示任务a在训练和验证集上的损失函数,任务a将在任务的测量值超过阈值ϵ时停止:
公式(5)中第一项代表训练误差,如果训练误差下降很快,第一项的值较小,表示训练可以继续,否则任务可以停止;第二项表示泛化误差。训练过程中使用SGD更新任务和滤波器的权值。对于浅层的滤波器,通过BP的loss误差计算梯度。浅层的误差如下计算:
实验结果
不同任务的收敛速率
自身不同方法的比较:
相关文章推荐
- Facial Landmark Detection by Deep Multi-task Learning
- 人脸关键点:TCDCN-Facial Landmark Detection by Deep Multi-task Learning
- Facial landmark detection by deep multi-task learning
- 论文《facial landmark detection by deep multi-task learning》读后小记
- Deep Region and Multi-label Learning for Facial Action Unit Detection简要论文笔记
- 深度学习入门学习:Multi-view Face Detection Using Deep Convolutional Neural Networks
- 论文复现报告:Deep Region and Multi-label Learning for Facial Action Unit Detection
- 深度神经网络的多任务学习概览(An Overview of Multi-task Learning in Deep Neural Networks) --多任务学习-2
- Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks 论文学习
- paper 159:文章解读:From Facial Parts Responses to Face Detection: A Deep Learning Approach--2015ICCV
- 【深度学习】论文导读:google的批正则方法(Batch Normalization: Accelerating Deep Network Training by Reducing...)
- [深度学习论文笔记][Image Reconstruction] Understanding Deep Image Representations by Inverting Them
- 深度学习 1. CNN的构建和解释--最简单的CNN构造(LeNet-5)# By deepLearnToolbox-master
- [深度学习论文笔记][Depth Estimation] Depth Map Prediction from a Single Image using a Multi-Scale Deep Netw
- 深度学习中的数学与技巧(2):《Batch Normalization Accelerating Deep Network Training by Reducing Interna
- Improving Multiview Face Detection with Multi-Task Deep Convolutional Neural Networks 基于深度学习的人脸检测算法
- Multi-view Face Detection Using Deep Convolutional Neural Networks, ICMR 15.
- 多任务学习(Multi-task learning)
- 【翻译】Convolutional Experts Network for Facial Landmark Detection
- 对Pedestrian Detection aided by Deep Learning Semantic Tasks的小结