低分辨率、非对齐、视频监控数据中的人脸识别(LFW, YTF)+CVPR2013
2014-01-13 18:07
302 查看
原文:http://m.blog.csdn.net/blog/yihaizhiyan/8890819
现有的人脸识别数据库,像Yale,YaleB,ORL等人脸数据库,分辨率高,良好对齐等datasets。。。
最近这方面的paper越来越少,逐渐向低分辨率、大数据库等监控中的images,更具挑战性的数据集转移~
最近看到一篇中科院的一篇CVPR2013中的paper:
“Fusing robust face region descriptors via multiple metric learning for face recognition in the wild, zhen cui, wen li, dong xu, shiguang shan, xilin chen” CVPR2013
作者地址:http://vipl.ict.ac.cn/members/zcui (并附有源码~ )
本文主要提供了一种抽取人脸区域描述子的方法。具体来说:
1、把每个图像分割为若干个空间块。
2、通过非负稀疏编码。。来表示每个块。 (represent each block by sum-pooling the nonnegative sparse codes of position-free patches sampled with the block.)
3、利用Whitened PCA 进行特征降维,从而产生区域人脸区域描述子。
4、介绍一种新的度量学习方法~ 名为:pairwise-constrained multiple metric learning。有效的整合所有block的脸部区域描述子。
最后再LFW 和 YouTube Faces (YTF)验证其方法。
LFW (Labeled Faces in the Wild)
YTF (YouTube Faces)
人脸识别的方法可以大致分为两种:
基于全局特征的方法:Eigenfaces、FisherFace
基于局部特征的方法:Gabor、LBP等 BoF (Bag of Feature)
在本文中,为了处理图像中的非对齐问题:
一方面,把每张图像分割为block集合,仅比较对应block的特征。
另一方面,每个block表示为无位置信息的patch集合
具体来说:
首先采用非负的稀疏编码,根据K-mean聚类得出的视觉字典,来量化每个patch;
然后通过sumpooling重构稀疏,为每个图像抽取TF(Token-Frequency)特征;
最后利用WPCA,降维,去噪,抽取空间脸部区域描述子。
废话少说,上图吧~ (发现中科院山老师那边,写文章很喜欢配个框架图,正应了无图不成文的说法,图示很清晰~)
分类方法:SVM+RBF kernel
这篇文章描述子的提取等,其实有分层的概念在里面,patch---》block便是分层的意思,另外一个便是局部信息,这是一个趋势:分层+局部
大致思想便是如此,其他便是公式和推导和细节~
这篇paper写的细节还是蛮清楚的~
但是dataset是个难点~ follow也是个问题~ 除非自己去crop and resize all images.
现有的人脸识别数据库,像Yale,YaleB,ORL等人脸数据库,分辨率高,良好对齐等datasets。。。
最近这方面的paper越来越少,逐渐向低分辨率、大数据库等监控中的images,更具挑战性的数据集转移~
最近看到一篇中科院的一篇CVPR2013中的paper:
“Fusing robust face region descriptors via multiple metric learning for face recognition in the wild, zhen cui, wen li, dong xu, shiguang shan, xilin chen” CVPR2013
作者地址:http://vipl.ict.ac.cn/members/zcui (并附有源码~ )
本文主要提供了一种抽取人脸区域描述子的方法。具体来说:
1、把每个图像分割为若干个空间块。
2、通过非负稀疏编码。。来表示每个块。 (represent each block by sum-pooling the nonnegative sparse codes of position-free patches sampled with the block.)
3、利用Whitened PCA 进行特征降维,从而产生区域人脸区域描述子。
4、介绍一种新的度量学习方法~ 名为:pairwise-constrained multiple metric learning。有效的整合所有block的脸部区域描述子。
最后再LFW 和 YouTube Faces (YTF)验证其方法。
LFW (Labeled Faces in the Wild)
YTF (YouTube Faces)
人脸识别的方法可以大致分为两种:
基于全局特征的方法:Eigenfaces、FisherFace
基于局部特征的方法:Gabor、LBP等 BoF (Bag of Feature)
在本文中,为了处理图像中的非对齐问题:
一方面,把每张图像分割为block集合,仅比较对应block的特征。
另一方面,每个block表示为无位置信息的patch集合
具体来说:
首先采用非负的稀疏编码,根据K-mean聚类得出的视觉字典,来量化每个patch;
然后通过sumpooling重构稀疏,为每个图像抽取TF(Token-Frequency)特征;
最后利用WPCA,降维,去噪,抽取空间脸部区域描述子。
废话少说,上图吧~ (发现中科院山老师那边,写文章很喜欢配个框架图,正应了无图不成文的说法,图示很清晰~)
分类方法:SVM+RBF kernel
这篇文章描述子的提取等,其实有分层的概念在里面,patch---》block便是分层的意思,另外一个便是局部信息,这是一个趋势:分层+局部
大致思想便是如此,其他便是公式和推导和细节~
这篇paper写的细节还是蛮清楚的~
但是dataset是个难点~ follow也是个问题~ 除非自己去crop and resize all images.
相关文章推荐
- 低分辨率、非对齐、视频监控数据中的人脸识别(LFW, YTF)+CVPR2013
- 人脸识别必读的N篇文章(1991-2013)
- 自动调参(GridSearchCV)及数据降维(PCA)在人脸识别中的应用
- 人脸识别引擎SeetaFaceEngine简介及在windows7 vs2013下的编译
- OpenCV实践之路——人脸识别之一数据收集和预处理
- 人脸识别引擎SeetaFaceEngine简介及在windows7 vs2013下的编译
- OpenCV实践之路——人脸识别之一数据收集和预处理
- 人脸对齐(一):An Empirical Study of Recent Face Alignment Methods (CVPR2015)
- 深度学习(十五)基于级联卷积神经网络的人脸特征点定位-CVPR 2013
- 【计算机视觉】人脸识别之人脸对齐(一)--定义及作用
- 直接获取摄像头传回的图像数据(人脸、微笑、眨眼: 识别-->第一步):图像识别第一步
- 人脸表情识别——定制自己的数据加载方式
- 常用的人脸识别数据资源
- Labeled Faces in the Wild 人脸识别数据集 部分测试数据
- OpenCV人脸识别之一:数据收集和预处理
- 利用Python sklearn的SVM对AT&T人脸数据进行人脸识别
- 人脸识别之人脸对齐(七)--JDA算法
- android jni中将大数据回调到java层的时候用法,比如视频流,音频流等,图片流等 比如我用ffmpeg解码好视频流,想送到java层使用opengGL进行显示,opencv进行人脸识别等等
- [opencv][python][scikit-learn]att_faces数据人脸识别
- 大数据早报:路桥率先利用“人脸识别”技术监管医保 亚马逊与微软联合开发人工智能,打造服务大众的AI(10.19)