论文阅读笔记——使用双向PCA进行行人检测
2014-03-02 11:34
411 查看
题目:Novel and efficient pedestrian detection using bidirectional PCA
作者:Thi-Hai-Binh Nguyen, Hakil Kim
年份:2013
期刊:Pattern Recognition
行人检测因其在视频监控、人机交互、救灾营救等众多领域具有巨大的潜在应用价值而备受工业界和学术界的广泛关注。因为行人是非刚性物体,没有统一的外体形状,因此相对于刚性物体目标检测而言,行人检测面临着更大的挑战。目前制约行人检测的因素概况为以下几个方面:
1、外形多样性
人体关节都有各自的运动范围,组合起来,就形成千变万化的姿态,比如人体胳膊的太高与放下,单脚着地或双脚着地,侧身或倒立等。
2、环境多样性
行人所处的背景环境各不相同,如品类繁多的商场、人流拥挤的车站、白天、晚上等。
3、相互遮挡
遮挡包含行人与其它物体遮挡或者行人欲行人之间的遮挡,这些遮挡都会使得行人的轮廓发生变化,进而影响特征提取与检测效果。
4、拍摄视觉
同样一个人,不同的拍摄视觉得到的外形特征是不一样的,如前向图片包含内容丰富,而侧面或者背面则包含较少的信息。
5、系统实时性
实时检测是制约行人检测的关键因素。经过多年的研究,学者们提出了许多有效的特征描述子(如:HOG 、SIFT等),但是因为特征提取复杂,无法使得检测系统达到实时。
行人检测的方法主要分为:基于图像的方法和基于特征的方法。基于图像的方法是直接以图像中的像素值作为特征值输入到分类器中,然后根据分类结果来判断图像是否是行人,该方法简单,但是像素强度不是有效的特征,检测结果容易受噪声的干扰。基于特征的方法,该方法相对比较成熟,而且也是目前的主流方法。虽然该方法对噪声有较好的鲁棒性,但是该方法的检测性能依赖于所使用的特征。因此,寻找有效的特征是目前研究的一个方向。
双向PCA
双向PCA(Bidirectional PCA, BDPCA)最初是由Yang's提出的。BDPCA与PCA不同,BDPCA通过利用行特征向量和列特征向量来计算图像的特征矩阵。假设X1,..,Xn表示含有n幅大小N*M为的图像集,avg_X表示所有图像的平均值,而S(row)表示行离散矩阵,S(col)表示列离散矩阵,它们分别通过如下公式计算:
由行离散矩阵的前k个最大特征值对应的向量构成行方向矩阵,同样列离散矩阵的前k个最大值特征对应的向量构成列方向矩阵。如下:
根据求得的行方向矩阵和列方向矩阵,便可以得到一幅图像的特征矩阵。其中Xi为大小为N*M的图像,其对应的特征矩阵如下:
利用得到特征矩阵,结合下式便可以得到该图像在该训练样本集的特征空间下的重构图像:
利用BDPCA进行行人检测
在对训练集的图像进行训练的时候,我们可以得到训练集中正样本的行和列的方向特矩阵以及列的行方向矩阵和列方向矩阵。那么给定一张测试图像,我们可以下式计算改图像在正样本集中的重构误差ep和负样本集的重构误差en。
根据不同的样本集中的重构误差,利用下式来判断图像是行人还是非行人。其中当d大于或等于0则认为是行人图像,反之为非行人图像。
利用BDPCA进行行人检测,其原理很简单。
作者:Thi-Hai-Binh Nguyen, Hakil Kim
年份:2013
期刊:Pattern Recognition
行人检测因其在视频监控、人机交互、救灾营救等众多领域具有巨大的潜在应用价值而备受工业界和学术界的广泛关注。因为行人是非刚性物体,没有统一的外体形状,因此相对于刚性物体目标检测而言,行人检测面临着更大的挑战。目前制约行人检测的因素概况为以下几个方面:
1、外形多样性
人体关节都有各自的运动范围,组合起来,就形成千变万化的姿态,比如人体胳膊的太高与放下,单脚着地或双脚着地,侧身或倒立等。
2、环境多样性
行人所处的背景环境各不相同,如品类繁多的商场、人流拥挤的车站、白天、晚上等。
3、相互遮挡
遮挡包含行人与其它物体遮挡或者行人欲行人之间的遮挡,这些遮挡都会使得行人的轮廓发生变化,进而影响特征提取与检测效果。
4、拍摄视觉
同样一个人,不同的拍摄视觉得到的外形特征是不一样的,如前向图片包含内容丰富,而侧面或者背面则包含较少的信息。
5、系统实时性
实时检测是制约行人检测的关键因素。经过多年的研究,学者们提出了许多有效的特征描述子(如:HOG 、SIFT等),但是因为特征提取复杂,无法使得检测系统达到实时。
行人检测的方法主要分为:基于图像的方法和基于特征的方法。基于图像的方法是直接以图像中的像素值作为特征值输入到分类器中,然后根据分类结果来判断图像是否是行人,该方法简单,但是像素强度不是有效的特征,检测结果容易受噪声的干扰。基于特征的方法,该方法相对比较成熟,而且也是目前的主流方法。虽然该方法对噪声有较好的鲁棒性,但是该方法的检测性能依赖于所使用的特征。因此,寻找有效的特征是目前研究的一个方向。
双向PCA
双向PCA(Bidirectional PCA, BDPCA)最初是由Yang's提出的。BDPCA与PCA不同,BDPCA通过利用行特征向量和列特征向量来计算图像的特征矩阵。假设X1,..,Xn表示含有n幅大小N*M为的图像集,avg_X表示所有图像的平均值,而S(row)表示行离散矩阵,S(col)表示列离散矩阵,它们分别通过如下公式计算:
由行离散矩阵的前k个最大特征值对应的向量构成行方向矩阵,同样列离散矩阵的前k个最大值特征对应的向量构成列方向矩阵。如下:
根据求得的行方向矩阵和列方向矩阵,便可以得到一幅图像的特征矩阵。其中Xi为大小为N*M的图像,其对应的特征矩阵如下:
利用得到特征矩阵,结合下式便可以得到该图像在该训练样本集的特征空间下的重构图像:
利用BDPCA进行行人检测
在对训练集的图像进行训练的时候,我们可以得到训练集中正样本的行和列的方向特矩阵以及列的行方向矩阵和列方向矩阵。那么给定一张测试图像,我们可以下式计算改图像在正样本集中的重构误差ep和负样本集的重构误差en。
根据不同的样本集中的重构误差,利用下式来判断图像是行人还是非行人。其中当d大于或等于0则认为是行人图像,反之为非行人图像。
利用BDPCA进行行人检测,其原理很简单。
相关文章推荐
- 《小超教你写论文》系列第四篇4.2-使用ACF算法进行行人检测
- 1707.ICCV.Neural Person Search Machines检测加识别 论文阅读笔记
- 【R笔记】使用R语言进行异常检测
- 深度学习笔记之使用Faster-Rcnn进行目标检测 (实践篇)
- 【论文笔记】使用物理原理和领域知识进行无标注的监督学习
- 行人检测论文笔记:Ten Years of Pedestrian Detection, What Have We Learned?
- 使用markdown进行代码阅读笔记
- Joint Deep Learning For Pedestrian Detection(论文笔记-深度学习:行人检测)
- 行人检测论文阅读
- 行人检测论文阅读(2)
- 行人检测论文笔记:How Far are We from Solving Pedestrian Detection?
- 图像分割、目标检测 MASK R-CNN 论文阅读笔记
- 深度学习笔记之使用Faster-Rcnn进行目标检测 (原理篇)
- 使用OpenCV+PCA+KNN/SVM进行人脸检测和识别-Python
- 行人检测论文笔记:Fast Feature Pyramids for Object Detection?
- 行人检测论文笔记:Robust Real-Time Face Detection
- 行人检测论文笔记:Robust Real-Time Face Detection
- 苹果最新机器学习论文:使用VoxelNet进行3D物体检测
- 文献《利用影像分割和匹配特征进行无人机影像变化检测》的阅读笔记