遮挡人脸检测--Detecting Masked Faces in the Wild with LLE-CNNs
2017-10-23 11:27
1596 查看
Detecting Masked Faces in the Wild with LLE-CNNs
CVPR2017
本文针对遮挡人脸检测问题,首先建立了一个新的数据库:MAFA, with 30,811 Internet images and 35,806 masked faces,其次提出了一个 CNN 网络 LLE-CNNs 来用于遮挡人脸检测。
首先来看看新建的数据库
3 MAFA: A Dataset of Masked Faces
3.1. Dataset Construction
我们首先用关键词为 face, mask, occlusion and cover 在网上搜索相关图像,得到大约 300K 张图像,然后过滤掉没有遮挡的图像,剩下 30,811 张图像,每张图像至少有一个遮挡人脸。
我们标记的信息如下:1) Location of faces 2) Locations of eyes 3) Locations of masks 4) Face orientation 5) Occlusion degree 6) Mask type
对于遮挡的人脸,两个眼睛还是相对稳定的特征点,眼睛基本不会被遮挡的,需要眼睛看东西啊
![](https://oscdn.geek-share.com/Uploads/Images/Content/202011/18/292299e51a87d0b6552fa1e16e2b9618)
![](https://oscdn.geek-share.com/Uploads/Images/Content/202011/18/49bccc871f8c94f2a44370dd14ae3cdf)
3.2. Dataset Statistics
![](https://oscdn.geek-share.com/Uploads/Images/Content/202011/18/18f2d6fb976804302b2a9c52b17d2b7f)
4 LLE-CNNs for Masked Face Detection
遮挡人脸检测存在两个大的挑战:incomplete facial cues and inaccurate features from mask regions。例如对于一张左侧人脸图像,其嘴巴、下巴、鼻子 都被一个mask 遮挡,导致大部分人脸特征点都是不可见的,从 mask 区域 提取的人脸特征向量含有大量噪声。在这个情况下 需要我们从人脸以外的区域提取额外的信息用于恢复人脸特征,降低噪声的影响。
LLE-CNNs
![](https://oscdn.geek-share.com/Uploads/Images/Content/202011/18/b8c61ad45bfd81a132b04ceb561decd0)
Proposal Module 人脸候选区域提取模块: 这里级联了两个CNN网络用于 人脸候选区域的生成及特征提取。候选区域的生成使用了文献【35】中的 P-Net,三个卷积层和一个 softmax layer,考虑到遮挡人脸检测难度较大,这里我们的阈值设置较低,生成了大量人脸候选区域。然后用 文献【24】的 VGG 人脸识别网络队每个候选区域 提取一个 4096d descriptor 在将其归一化。这个descriptor 即含有有用信息也含有噪声信息。 the extracted high-dimensional descriptor encodes bothv aluable facial cues as well as the noisy features from mask regions
Embedding Module 这个模块主要实现对被遮挡的人脸特征恢复,抑制特征中的噪声信息。
The embedding module recovers the missing facial cues in x and suppresses the noisy features incorporated by mask regions.
Toward this end, a feasible solution is to find the most similar faces or non-faces from an external database and use them to refine x .
这里主要通过查字典的方式 试图将被遮挡的特征区域恢复出来
Verification Module 利用被修复的人脸特征进行人脸区域验证 ,对人脸位置和尺度的微调,
The verification module classifies face candidates from the refined facial cues and refines their positions as well as scales
5 Experiments
![](https://oscdn.geek-share.com/Uploads/Images/Content/202011/18/82e0e94cf109dbe4d0d8841888f5db19)
![](https://oscdn.geek-share.com/Uploads/Images/Content/202011/18/c16ca066d47549f1cf415d0e162b2ad2)
11
CVPR2017
本文针对遮挡人脸检测问题,首先建立了一个新的数据库:MAFA, with 30,811 Internet images and 35,806 masked faces,其次提出了一个 CNN 网络 LLE-CNNs 来用于遮挡人脸检测。
首先来看看新建的数据库
3 MAFA: A Dataset of Masked Faces
3.1. Dataset Construction
我们首先用关键词为 face, mask, occlusion and cover 在网上搜索相关图像,得到大约 300K 张图像,然后过滤掉没有遮挡的图像,剩下 30,811 张图像,每张图像至少有一个遮挡人脸。
我们标记的信息如下:1) Location of faces 2) Locations of eyes 3) Locations of masks 4) Face orientation 5) Occlusion degree 6) Mask type
对于遮挡的人脸,两个眼睛还是相对稳定的特征点,眼睛基本不会被遮挡的,需要眼睛看东西啊
3.2. Dataset Statistics
4 LLE-CNNs for Masked Face Detection
遮挡人脸检测存在两个大的挑战:incomplete facial cues and inaccurate features from mask regions。例如对于一张左侧人脸图像,其嘴巴、下巴、鼻子 都被一个mask 遮挡,导致大部分人脸特征点都是不可见的,从 mask 区域 提取的人脸特征向量含有大量噪声。在这个情况下 需要我们从人脸以外的区域提取额外的信息用于恢复人脸特征,降低噪声的影响。
LLE-CNNs
Proposal Module 人脸候选区域提取模块: 这里级联了两个CNN网络用于 人脸候选区域的生成及特征提取。候选区域的生成使用了文献【35】中的 P-Net,三个卷积层和一个 softmax layer,考虑到遮挡人脸检测难度较大,这里我们的阈值设置较低,生成了大量人脸候选区域。然后用 文献【24】的 VGG 人脸识别网络队每个候选区域 提取一个 4096d descriptor 在将其归一化。这个descriptor 即含有有用信息也含有噪声信息。 the extracted high-dimensional descriptor encodes bothv aluable facial cues as well as the noisy features from mask regions
Embedding Module 这个模块主要实现对被遮挡的人脸特征恢复,抑制特征中的噪声信息。
The embedding module recovers the missing facial cues in x and suppresses the noisy features incorporated by mask regions.
Toward this end, a feasible solution is to find the most similar faces or non-faces from an external database and use them to refine x .
这里主要通过查字典的方式 试图将被遮挡的特征区域恢复出来
Verification Module 利用被修复的人脸特征进行人脸区域验证 ,对人脸位置和尺度的微调,
The verification module classifies face candidates from the refined facial cues and refines their positions as well as scales
5 Experiments
11
相关文章推荐
- 快速多尺度人脸检测2--Multi-Scale Fully Convolutional Network for Face Detection in the Wild
- 【论文笔记】Recover Canonical-View Faces in the Wild with Deep Neural Network
- 深度学习论文笔记--Recover Canonical-View Faces in the Wild with Deep Neural Network
- Labeled Faces in the Wild 人脸识别数据集 部分测试数据
- Labeled Faces in the Wild 人脸识别数据集
- Labeled Faces in the Wild 人脸识别数据集
- 用 Python 和 OpenCV 检测图片上的条形码Detecting Barcodes in Images with Python and OpenCV
- 论文阅读:Reading Text in the Wild with Convolutional Neural Networks
- 文本检测论文阅读-Object Proposals for Text Extraction in the WildSelective Search for Object Recoginition。
- 级联人脸检测--Detecting Faces Using Inside Cascaded Contextual CNN
- Face Detection with the Faster R-CNN (基于Faster RCNN的人脸检测)
- 大角度人脸转正--Towards Large-Pose Face Frontalization in the Wild
- 人脸检测--Grid Loss: Detecting Occluded Faces
- Sandbox Evasion with COM by Malware in-the-Wild
- 人脸识别 - Pose-Aware Face Recognition in the Wild
- 人脸对齐--Face Alignment In-the-Wild: A Survey
- 【论文笔记】Recursive Recurrent Nets with Attention Modeling for OCR in the Wild
- 论文阅读:Reading Text in the Wild with Convolutional Neural Networks
- 大角度人脸转正--Towards Large-Pose Face Frontalization in the Wild
- 小人脸检测 - Finding Tiny Faces