人脸识别之PDM模型-Training Models of Shape from Sets of Examples
2018-03-01 11:26
302 查看
这是我找到的最早关于人脸识别中PDM模型的论文。对该论文翻译并进行了深入的理解。1 点分布模型 假设我们希望推导出一个表示印刷电路板上的电阻的模型,就像图1显示的那样。不同的电阻有不同的形状,所以刚性模型将是不适用的。图2显示了一些从各个电阻的背光图像获得的电阻边界的一些示例。我们的目标是使用图2的例子作为训练集建立一个描述典型形状和允许变化的模型。
[align=center][/align]1.1 标记训练集 为了建模一个形状,我们通过一系列点来表示。我们已经在电阻的周围选择性的放置了一些点,如图3所示。必须要为训练集中的每一个图形做。这些标记点是十分重要的,每一个标记的点表示对象的一个特定部分或其边界。例如,在电阻模型中,点0和31 总是表示导线的结束,3,4,5表示电阻的最边位置。这个方法的工作原理是模拟不同标记点在形状变化时如何移动。如果标记不正确,则在每个训练形状的不同位置放置一个特定的点,该方法将无法捕捉形状变化。
这些点正确的放置在每个例子图像位置上是十分重要的。这通常会要求熟悉应用的人去选择最合适的一组点,并能够将这些点放置在不同的例子中。这个过程是需要花费时间的,虽然我们已经开发了很多工具去加速这一进程。应该注意的是,虽然标记训练集是人为做的,但是找到平均形状和主要的变化模式是自动的。手动的减少这些变化模式是非常困难的,尤其是对于更复杂的生物的形状。1.2 对齐训练集 我们的建模方法是通过检查训练集上标记点的坐标的统计来工作的。为了能够比较不同形状的等价点,他们必须使用相同的方式对齐一组轴。我们通过缩放、旋转和平移训练形状来实现所需的对齐,以使他们尽可能的接近。我们的目标是求得不同形状上的等效点之间的距离的平方和的最小值。这是广义Procrustes分析的一种形式。 我们首先考虑对齐两个形状,xi是描述第i个形状的n个点的向量:
Mj[xj]是旋转θj,缩放sj,给出两个相似的形状,xi,xj,我们可以通过选择θj和sj,一个平移(tx,ty)j,Mj[xj]使得xi和xj匹配。最小化的权重和为:
W是每个点的权重构成的对角矩阵。 可以通过选择权重给那些在整个集合上最稳定的点赋予跟多的重要性,最稳定的点也就是相对于形状的其他点移动的最少的那些点。我们已经使用了一个这样的矩阵:Rkl是形状点中的k点和l点之间的距离,VRkl是这一组形状上的点k到l距离的方差,我们能得到一个权重,第k个点的权重可以表示为:
如果一个点相对于形状中的其他点移动的距离比较多,那么这个方差的和将会很大,赋予的权重将会比较小。相反,如果一个点相对于其他点移动的距离少,方差之和就比较小,将会赋予较大的权重,匹配形状时会优先匹配这些权重大的点。 如果我们使得
那么利用最小二乘法来求(ax,ay,tx,ty)
此处最小二乘法向量(ax,ay,tx,ty)的解就可以二范数的极小值解得。
为了对齐一个集合中的所有的形状,我们使用下面的算法: (1) 旋转,平移和缩放集合中的每一个形状与第一个形状对齐。 (2) 计算平均的对齐形状 (3) a)将平均形状调整为默认比例,方向和坐标原点 b)旋转、缩放平移平均形状和第一个形状对齐 (4) 旋转、缩放,平移每一个形状与调整之后的平均形状对齐 重复(2)(3)(4)直到收敛。 迭代循环的第3阶段需要重新标准化平均值。如果没有这一步,这个算法是不正确的,将不会收敛。平均值将缩小,旋转或滑动至无穷远。对平均形状的位置和缩放的约束允许方程具有唯一解。平均形状被缩放,旋转,平移,因此它与第一个形状相匹配,或者可以使用任意的默认设置,例如在重心处选择原点,取向使得形状的特定部分位于顶部,以及两点之间的距离为一个单位的比例。 收敛条件可以通过检查每个形状与重新计算的平均形状和身份变换对齐所需的变换之间的平均差异来测试。实验显示,该方法收敛的结果是相同的,不依赖于第一阶段对齐的是不是第一个形状。1.3捕获一组形状的对齐 只要有一组可以对齐的形状可以使用,就可以得到平均形状和变化的内容。平均形状:
通过将主成分分析应用到偏离均值的方法中,可以发现形状的变化方式,即形状的点在一起移动的方式。 对于训练集中的每一个形状,我们计算它与平均值的偏差,dxi
我们可以计算2n*2n的协方差矩阵S
我们可以使用S的特征向量pi来描述点构成形状的变化模式:
可以证明,对应于最大特征值的协方差矩阵的特征向量描述了用于推导协方差矩阵的变量中最显着的变化模式,并且由每个特征向量所占总方差解释的比例等于对应的特征值。大部分变化模式可以用少量的t模式来解释。 一种计算方法是选择最小的模式数量,以便解释的方差之和是λT的足够大的比例,即所有变量的总方差
训练集中的任何形状都可以使用平均形状和从前t个模式获得的这些偏差的加权和来近似
是前t个特征向量组成的矩阵
是每个特征向量对应的权重,特征向量之间是正交的。
上述方程允许我们生成新形状的例子,在合适的范围内改变参数(bi)。 这些参数是线性独立的,尽管仍然存在非线性依赖关系。 bi的限制是通过检查生成训练集所需的参数值的分布而得出的。 由于训练集上的i的方差可以表示为λi,所以合适的限制很可能的范围:
[align=center]
[/align] 平均形状,b相当于是对平均形状的一系列调整,根据式(11),我们可以通过调整b的值得到新的形状,都是对全局形状进行变形。而在人脸识别的过程中,得到形状xi,原本存在上式,利用式(12)求出向量b,如果所有的bi都在合适的范围之内,则说明为人脸,否则不是人脸。[align=left] 此节需要好好的看一下主成分分析的原理以及方法[/align][align=left][/align]2 例子2.1 电阻 使用上述方法对齐电阻器形状,将平均形状设置为水平并缩放,以使平均值的每个点与其重心的平均距离为一个单位。表1中显示了导出的协方差矩阵的最显着的特征值。[align=center] 表1:从一组电阻形状导出的协方差矩阵的特征值[/align]
图4显示了训练集b1与b2对齐的图。散点图中缺少结构表明参数可以被视为独立。我们正在努力推出更正式的独立测试。参数之间的任何依赖关系都意味着原始点位置之间的非线性关系,并会导致生成“非法”形状的参数的某些组合。通过分别改变前三个参数,我们可以生成如图5-7所示的形状的示例。每个参数'表示'形状的变化模式,其可以经常与变形的直观描述相关联。将图5-7与图2进行比较。改变第一个参数(b1)可调整电阻体上下导线的位置。第二个参数改变了电阻器主体的端部在锥形和正方形之间的形状。第三个参数影响两端电线的曲率。随后的参数具有较小的影响,包括导线弯曲方向相反。这些变异模式有效地捕捉到训练集中存在的变异性。
2.2 手 其中一位作者的右手图像生成了一组18个手形(图8)。 边界周围各有72个点。 通过在手指的端部和关节处定位12个控制点并沿着连接边界均匀地填充其余部分,将这些种植在示例上。 对数据进行模型训练,发现96%的差异可以用前6种变化模式来解释。 前三种模式如图9所示,由手指的运动组合组成。 再次,生成了一个紧凑的参数化模型。
Training Models of Shape from Sets of Examples -TECootes, CJ.Taylor, D.H.Cooper and J.Graham
[align=center][/align]1.1 标记训练集 为了建模一个形状,我们通过一系列点来表示。我们已经在电阻的周围选择性的放置了一些点,如图3所示。必须要为训练集中的每一个图形做。这些标记点是十分重要的,每一个标记的点表示对象的一个特定部分或其边界。例如,在电阻模型中,点0和31 总是表示导线的结束,3,4,5表示电阻的最边位置。这个方法的工作原理是模拟不同标记点在形状变化时如何移动。如果标记不正确,则在每个训练形状的不同位置放置一个特定的点,该方法将无法捕捉形状变化。
这些点正确的放置在每个例子图像位置上是十分重要的。这通常会要求熟悉应用的人去选择最合适的一组点,并能够将这些点放置在不同的例子中。这个过程是需要花费时间的,虽然我们已经开发了很多工具去加速这一进程。应该注意的是,虽然标记训练集是人为做的,但是找到平均形状和主要的变化模式是自动的。手动的减少这些变化模式是非常困难的,尤其是对于更复杂的生物的形状。1.2 对齐训练集 我们的建模方法是通过检查训练集上标记点的坐标的统计来工作的。为了能够比较不同形状的等价点,他们必须使用相同的方式对齐一组轴。我们通过缩放、旋转和平移训练形状来实现所需的对齐,以使他们尽可能的接近。我们的目标是求得不同形状上的等效点之间的距离的平方和的最小值。这是广义Procrustes分析的一种形式。 我们首先考虑对齐两个形状,xi是描述第i个形状的n个点的向量:
Mj[xj]是旋转θj,缩放sj,给出两个相似的形状,xi,xj,我们可以通过选择θj和sj,一个平移(tx,ty)j,Mj[xj]使得xi和xj匹配。最小化的权重和为:
W是每个点的权重构成的对角矩阵。 可以通过选择权重给那些在整个集合上最稳定的点赋予跟多的重要性,最稳定的点也就是相对于形状的其他点移动的最少的那些点。我们已经使用了一个这样的矩阵:Rkl是形状点中的k点和l点之间的距离,VRkl是这一组形状上的点k到l距离的方差,我们能得到一个权重,第k个点的权重可以表示为:
如果一个点相对于形状中的其他点移动的距离比较多,那么这个方差的和将会很大,赋予的权重将会比较小。相反,如果一个点相对于其他点移动的距离少,方差之和就比较小,将会赋予较大的权重,匹配形状时会优先匹配这些权重大的点。 如果我们使得
那么利用最小二乘法来求(ax,ay,tx,ty)
此处最小二乘法向量(ax,ay,tx,ty)的解就可以二范数的极小值解得。
为了对齐一个集合中的所有的形状,我们使用下面的算法: (1) 旋转,平移和缩放集合中的每一个形状与第一个形状对齐。 (2) 计算平均的对齐形状 (3) a)将平均形状调整为默认比例,方向和坐标原点 b)旋转、缩放平移平均形状和第一个形状对齐 (4) 旋转、缩放,平移每一个形状与调整之后的平均形状对齐 重复(2)(3)(4)直到收敛。 迭代循环的第3阶段需要重新标准化平均值。如果没有这一步,这个算法是不正确的,将不会收敛。平均值将缩小,旋转或滑动至无穷远。对平均形状的位置和缩放的约束允许方程具有唯一解。平均形状被缩放,旋转,平移,因此它与第一个形状相匹配,或者可以使用任意的默认设置,例如在重心处选择原点,取向使得形状的特定部分位于顶部,以及两点之间的距离为一个单位的比例。 收敛条件可以通过检查每个形状与重新计算的平均形状和身份变换对齐所需的变换之间的平均差异来测试。实验显示,该方法收敛的结果是相同的,不依赖于第一阶段对齐的是不是第一个形状。1.3捕获一组形状的对齐 只要有一组可以对齐的形状可以使用,就可以得到平均形状和变化的内容。平均形状:
通过将主成分分析应用到偏离均值的方法中,可以发现形状的变化方式,即形状的点在一起移动的方式。 对于训练集中的每一个形状,我们计算它与平均值的偏差,dxi
我们可以计算2n*2n的协方差矩阵S
我们可以使用S的特征向量pi来描述点构成形状的变化模式:
可以证明,对应于最大特征值的协方差矩阵的特征向量描述了用于推导协方差矩阵的变量中最显着的变化模式,并且由每个特征向量所占总方差解释的比例等于对应的特征值。大部分变化模式可以用少量的t模式来解释。 一种计算方法是选择最小的模式数量,以便解释的方差之和是λT的足够大的比例,即所有变量的总方差
训练集中的任何形状都可以使用平均形状和从前t个模式获得的这些偏差的加权和来近似
是前t个特征向量组成的矩阵
是每个特征向量对应的权重,特征向量之间是正交的。
上述方程允许我们生成新形状的例子,在合适的范围内改变参数(bi)。 这些参数是线性独立的,尽管仍然存在非线性依赖关系。 bi的限制是通过检查生成训练集所需的参数值的分布而得出的。 由于训练集上的i的方差可以表示为λi,所以合适的限制很可能的范围:
[align=center]
[/align] 平均形状,b相当于是对平均形状的一系列调整,根据式(11),我们可以通过调整b的值得到新的形状,都是对全局形状进行变形。而在人脸识别的过程中,得到形状xi,原本存在上式,利用式(12)求出向量b,如果所有的bi都在合适的范围之内,则说明为人脸,否则不是人脸。[align=left] 此节需要好好的看一下主成分分析的原理以及方法[/align][align=left][/align]2 例子2.1 电阻 使用上述方法对齐电阻器形状,将平均形状设置为水平并缩放,以使平均值的每个点与其重心的平均距离为一个单位。表1中显示了导出的协方差矩阵的最显着的特征值。[align=center] 表1:从一组电阻形状导出的协方差矩阵的特征值[/align]
图4显示了训练集b1与b2对齐的图。散点图中缺少结构表明参数可以被视为独立。我们正在努力推出更正式的独立测试。参数之间的任何依赖关系都意味着原始点位置之间的非线性关系,并会导致生成“非法”形状的参数的某些组合。通过分别改变前三个参数,我们可以生成如图5-7所示的形状的示例。每个参数'表示'形状的变化模式,其可以经常与变形的直观描述相关联。将图5-7与图2进行比较。改变第一个参数(b1)可调整电阻体上下导线的位置。第二个参数改变了电阻器主体的端部在锥形和正方形之间的形状。第三个参数影响两端电线的曲率。随后的参数具有较小的影响,包括导线弯曲方向相反。这些变异模式有效地捕捉到训练集中存在的变异性。
2.2 手 其中一位作者的右手图像生成了一组18个手形(图8)。 边界周围各有72个点。 通过在手指的端部和关节处定位12个控制点并沿着连接边界均匀地填充其余部分,将这些种植在示例上。 对数据进行模型训练,发现96%的差异可以用前6种变化模式来解释。 前三种模式如图9所示,由手指的运动组合组成。 再次,生成了一个紧凑的参数化模型。
Training Models of Shape from Sets of Examples -TECootes, CJ.Taylor, D.H.Cooper and J.Graham
相关文章推荐
- 人脸识别之ASM模型-Active Shape Models - 'Smart Snakes'
- 从频率到意义:语义向量空间模型(1)(From Frequency to Meaning: Vector Space Models of Semantics)
- 从频率到意义:语义向量空间模型(2)(From Frequency to Meaning: Vector Space Models of Semantics)
- 人脸对齐(二):Active Shape Models ---Their Training and Application
- 从频率到意义:语义向量空间模型(4)(From Frequency to Meaning: Vector Space Models of Semantics)
- 从频率到意义:语义向量空间模型(3)(From Frequency to Meaning: Vector Space Models of Semantics)
- 论文笔记《End-to-End Training of Hybrid CNN-CRF Models for Stereo》用于立体评估的端到端训练的混合CNN-CRF模型
- 百度DMLC分布式深度机器学习开源项目(简称“深盟”)上线了如xgboost(速度快效果好的Boosting模型)、CXXNET(极致的C++深度学习库)、Minerva(高效灵活的并行深度学习引擎)以及Parameter Server(一小时训练600T数据)等产品,在语音识别、OCR识别、人脸识别以及计算效率提升上发布了多个成熟产品。
- 下一代机器学习-在浏览器中训练深度学习模型Next Generation Machine Learning - Training Deep Learning Models in a Browser
- SIFT算法的应用--目标识别之Bag-of-words模型
- SIFT算法的应用--目标识别之Bag-of-words模型
- OpenCV人脸识别之二:模型训练
- 第九章三续:SIFT算法的应用--目标识别之Bag-of-words模型
- 人脸检测及识别python实现系列(3)——为模型训练准备人脸数据
- python多进程,使用用微软RENET模型的视频人脸识别程序
- SIFT算法的应用--目标识别之Bag-of-words模型(转)
- 第九章三续:SIFT算法的应用--目标识别之Bag-of-words模型
- CMU提出对抗生成网络:可实现对人脸识别模型的神经网络攻击
- 【机器学习实践】人脸识别模型结果对比
- Android 人脸特征点检测(主动形状模型) ASM Demo (Active Shape Model on Android)