您的位置:首页 > 其它

人脸识别的三个阶段

2014-07-23 16:30 609 查看
人脸识别是一个被广泛研究着的热门问题,大量的研究论文层出不穷。为了更好地对人脸识别研究的历史和现状进行介绍,我们将按照研究内容、技术方法等方面的特点大体划分为三个时间阶段来作介绍。
第一阶段(1964~1990年)
这一阶段人脸识别通常只是作为一个一般性的模式识别问题被研究,所采用的主要技术方案是基于人脸几何结构特征(Geometric feature based)的方法,这集中体现在人们对于剪影(Profile)的研究上,人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。人工神经网络也一度曾经被研究人员用于人脸识别问题中。较早从事AFR研究的研究人员除了Bledsoe外还有Goldstein,Harmon以及Kanade等。Kanade博士于1973年在京都大学完成了第一篇AFR方面的博士论文,直到现在,作为卡内基-梅隆大学(CMU)机器人研究院的一名教授,Kanade博士仍然是人脸识别领域的活跃人物之一,他所在的研究组也是人脸识别领域的一支重要力量。总体而言,这一阶段是人脸识别研究的初级阶段,非常重要的成果不是很多,也基本没有获得实际应用。
第二阶段(1991~1997年)
这一阶段尽管时间相对短暂,但却是人脸识别研究的高潮期,可谓硕果累累:不但诞生了若干代表性的人脸识别算法,美国军方还组织了著名的FERET人脸识别算法测试,并出现了若干商业化运作的人脸识别系统,比如最为著名的Visionics(现为Identix)的FaceIt系统。
麻省理工学院媒体实验室的Turk和Pentland提出的“Eigenface”方法无疑是这一时期内最负盛名的人脸识别方法。其后的很多人脸识别技术都或多或少与Eigenface有关系,现在Eigenface已经与归一化的协相关量(NormalizedCorrelation)方法一道成为人脸识别的性能测试基准算法。
这一时期的另一个重要工作是麻省理工学院AI实验室的Brunelli和Poggio于1992年左右做的一个对比实验,他们对比了基于结构特征的方法与基于模板匹配的方法的识别性能,并给出了一个比较确定的结论:模板匹配的方法优于基于特征的方法。这一导向性的结论与Eigenface共同作用,基本中止了纯粹的基于结构特征的人脸识别方法研究,并在很大程度上促进了基于表观(Appearance-based)的线性子空间建模和基于统计模式识别技术的人脸识别方法的发展——他们逐渐成为主流的人脸识别技术。
Belhumeur等提出的Fisherface人脸识别方法是这一时期的另一重要成果。该方法首先采用主成分分析(Principal
Component Analysis,PCA,亦即Eigenface)对图像表观特征进行降维,在此基础上,采用线性判别分析(Linear
Discriminant Analysis, LDA)的方法变换降维后的主成分以期获得“尽量大的类间散度和尽量小的类内散度”。该方法目前仍然是主流的人脸识别方法之一,产生了很多不同的变种。
MIT的Moghaddam则在Eigenface的基础上,提出了基于双子空间进行贝叶斯概率估计的人脸识别方法。人脸识别中的另一种重要方法——弹性图匹配技术(Elastic
Graph Matching,EGM)也是在这一阶段提出的。
由美国国防部反毒品技术发展计划办公室资助的FERET(FacE REcognition technology Test)项目无疑是该阶段内的一个至关重要的事件。FERET项目的目标是要开发能够为安全、情报和执法部门使用的AFR技术。该项目包括三部分内容:资助若干项人脸识别研究、创建FERET人脸图像数据库、组织FERET人脸识别性能评测。该项目分别于1994年、1995年和1996年组织了3次人脸识别评测,几种最知名的人脸识别算法都参加了测试,极大促进了这些算法的改进和实用化。该测试的另一个重要贡献是给出了人脸识别的进一步发展方向:光照、姿态等非理想采集条件下的人脸识别问题逐渐成为热点的研究方向。
第三阶段(1998年~现在)
FERET’96人脸识别算法评估表明:主流的人脸识别技术对光照、姿态等由于非理想采集条件或者用户不配合造成的变化鲁棒性比较差。因此,光照、姿态问题逐渐成为研究热点。与此同时,人脸识别的商业系统进一步发展,为此,美国军方在FERET测试的基础上分别于2000年和2002年组织了两次商业系统评测。
以支持向量机(Support Vector Machines,SVMs)为代表的统计学习理论也在这一时期内被应用到了人脸识别与确认中来。SVMs是一个两类分类器,而人脸识别则是一个多类问题,通常有三种策略解决这个问题,即:类内差/类间差法、一对多法(one-to-rest)和一对一法(one-to-one)。
Blanz和Vetter等提出的基于3D变形(3D
Morphable Model)模型的多姿态、多光照条件人脸图像分析与识别方法是这一阶段内一项开创性的工作。该方法在本质上属于基于合成的分析技术,可以使得人脸形状和纹理等人脸内部属性与摄像机配置、光照情况等外部参数完全分开,更加有利于人脸图像的分析与识别。实验表明,该方法在CMU-PIE(多姿态、光照和表情)人脸库和FERET多姿态人脸库上都达到了相当高的识别率,证明了该方法的有效性。
Shashua等在2001年提出了一种基于商图像的人脸图像识别与绘制技术。Basri和Jacobs则利用球面谐波(Spherical
Harmonics)表示光照、用卷积过程描述朗博反射的方法解析地证明了一个重要的结论:由任意远点光源获得的所有朗博反射函数的集合形成一个线性子空间。这为光照问题的解决提供了重要思路。
FERET项目之后,涌现了若干人脸识别商业系统,美国国防部有关部门进一步组织了针对人脸识别商业系统的评测——Face Recognition Vendor Test(FRVT),至今已经举办了两次:FRVT2000以及FRVT2002测试。这两次测试一方面对知名的人脸识别系统进行了性能比较,例如FRVT2002测试就表明Cognitec、Identix和Eyematic三个商业产品遥遥领先于其他系统,而它们之间的差别不大。另一方面则全面总结了人脸识别技术发展的现状:较理想条件下(正面签证照),针对37437人121589幅图像的人脸识别(Identification)最高首选识别率为73%,人脸验证(Verification)的等错误率大约为6%。FRVT测试的另一个重要贡献是还进一步指出了目前的人脸识别算法亟待解决的若干问题。
总体而言,目前非理想成像条件下的人脸识别问题逐渐成为研究的热点问题。而非线性建模方法、统计学习理论、基于Boosting的学习技术、基于3D模型的人脸建模与识别方法等逐渐成为备受重视的技术发展趋势。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: