您的位置:首页 > Web前端

经典论文阅读笔记——Feature篇(下)

2016-01-04 16:45 387 查看

7.《Robust Real-time Face Detection》(IJCV 2004)

这篇文章重点并不在特征上而是Adaboost的应用,但基于它的名气也放在这里吧,在深度学习没火起来之前应该算是最最常用的人脸检测算法了。

核心思路如下:

求取图像积分图(快速计算);
采用Adaboost算法选择特征:每一次迭代选择一个最优Haar特征(弱分类器),多次迭代的Haar特征进行组合(强分类器);
通过预设的检测率、误识率等参数进行多次2步骤,将强分类器级联;
滑窗方法检测,多尺度通过对图像大小进行尺度变换得到。

值得注意的地方:

Haar特征非常适用于Adaboost这类型的组合算法,因为一张图的Haar特征非常非常多
将多种特征进行组合的算法,如Boosting, Bootstrap这类都属于框架算法,里面具体的特征可以任意使用
Adaboost算法目的是获得强分类器,而将强分类器进行级联,可以在保证检测率的基础上降低误识率(单个分类器很难做到如此精确)
积分图思想很是常用,图像中需要重复多次计算的都能用积分图加速(个人感觉和动态规划里的Memoization思想类似)
非常经典的一篇人脸检测论文,但是感觉并不是非常好懂,尤其是中间很大篇幅第一次看感觉都是云里雾里的,逻辑关系不大好弄清楚。不过网上解析的博客什么的很多,对理解很有帮助的。

8.《Histograms of oriented gradients for human detection》(CVPR 2005)

大名鼎鼎的HOG(为什么都是大名鼎鼎。。),思想和SIFT特征那一块有相像之处,简单易懂并且可以可视化,最初用在行人检测上。

核心思路如下:

对图像进行Gamma校正(可做可不做,论文里也说效果提升不是非常明显);
计算各个像素梯度;
将图像划分为cell,计算cell内的梯度加权直方图;
将cell组合成block,把各cell内特征相连并归一化(block中的cell有重叠);
将block内特征连接即为当前图像(滑窗)的HOG特征。

值得注意的地方:

与SIFT相似,在计算梯度加权直方图时,同样要进行插值操作以增加准确性
除了矩形block外,原文还提出一种圆形block,感觉和GLOH有点像
在HOG特征上使用机器学习工具非常易于理解,如SVM等,原文也给出了SVM权重可视化图
这篇论文并没有写太多的实现细节,而是对步骤的各个方面都做了充分的实验,以图或表的形式展现出来,非常有说服力,确实是一篇经典论文。如果想看更多的细节可以看看原作者的博士论文及PPT啥的,网上也有很多解析,比较易于理解。

9.《Retrieval and classification of shape-based objects using Fourier, generic Fourier, and wavelet-Fourier descriptors technique: A comparative study》(Elsevier 2007)

说实话这根本不算是一篇经典的论文,但因为是通过这篇文章理解的傅里叶描述子相关的特征,也把它放上来吧。傅里叶描述子直接通过边缘进行特征描述,非常简单。
核心思路如下:

提取图像边缘;
通过一个一维函数对边缘进行描述(可以仅仅将边缘坐标视为复数进行描述,也可以利用边缘各点到图像中心距离进行描述);
对一维描述函数进行傅里叶变化,即得到傅里叶描述子。
值得注意的地方:

傅里叶描述子特征思路非常简单,先对特征进行空域上的描述,然后变换至频域
文章说中心距离的描述方法要优于直接进行复数描述,这点仍待商榷
以上说的是基于边缘的傅里叶描述子,也有基于区域的(通用傅里叶描述子,GFD)
描述子的归一化应该注意一下
傅里叶描述子一听就是基于变换域的方法,在此基础上还发展出了小波描述子(WT)等等,也算是简单常用的边缘形状描述方法。

10.《SURF: Speeded Up Robust Features》(Elsevier 2008)

SURF特征,类SIFT特征中最出名的一种,思路同样是先找兴趣点然后对其赋予向量,实验来看速度的确要比SIFT快,但是感觉效果还是不如SIFT好。

核心思路如下:

利用Hessian矩阵行列式作为兴趣点检测方法,采用近似计算,并利用积分图加速;
与SIFT不同,SURF特征保持图像尺寸不变,改变高斯模糊模板大小达到多尺度目的;
在利用非极大值抑制初步确定特征点后,也采用拟合尺度空间函数与类Harris角点检测方法精确定位特征点;
通过统计特征点领域(60°扇形区域)内的Haar小波特征加权矢量,取最长矢量方向为确定特征点主方向;
将坐标轴旋转至主方向,类似于SIFT,将特征点矩形领域分块,并统计各个块内的4种小波特征分量,构成该点的SURF特征;
匹配过程与SIFT类似。

值得注意的地方:

Hessian矩阵的迹就是Laplace算子,而行列式值也能用于检测特征点
近似计算Hessian矩阵行列式并采用积分图同样是为了加速,于SIFT采用DoG近似LoG的动机一样
尺度空间的生成与SIFT整好反过来,仔细想想其实非常有趣,比如说在SURF里哪一个可以看做是Octave

多少感觉SURF确定主方向的方法有些诡异,还是SIFT的更加清楚,实验结果也显示更稳定一些
类SIFT特征中比较出名的有PCA-SIFT, SURF, GLOH等,它们的思想和各个步骤其实都非常一致,只不过采用的方法不尽相同。不过就实验结果来看,这几种特征的效果确实都没有原来的SIFT好。

11.《A fully affine invariant image comparison method》(IEEE 2009)

ASIFT,用的也不是非常广泛,就把它当作这个系列的最后一个特征吧。SIFT原文中说并不是非常需要仿射不变性,这篇文章就说仿射不变性很重要,还是有的好。。

核心思路如下:

先对仿射变换进行了建模,提出了模型的各个参数;
针对参数的不同取值,采取对原图采样的方法对其进行模拟,得到多幅图像;
对多幅图像进行SIFT特征的提取,可以得到特征的仿射不变性。

值得注意的地方:

思路很简单,不是没有仿射不变性么,那我就把仿射模拟出来,再在其基础上提取特征,就具有不变性了
文章对仿射模型的说明比较清晰,对此不熟悉的可以看一下
显然对多幅图像进行SIFT特征提取需要花费更多的时间,文章中说ASIFT的复杂度基本是SIFT的两倍,因为没有做过实验,暂不清楚究竟到什么程度
论文写得非常清晰,尤其介绍模型那一块我感觉很好,思路也很简单。但是总感觉实际中并不需要完全的仿射不变性,而且对很多幅图像都提取SIFT特征的时间一定不会太短。。

特征部分总结

从论文发表的时间上也可以看出,近些年很少有专门研究特征的,研究的重点已经远远不在特征本身上了,有也是对之前特征的一些改进和提升。并且随着特征的发展,感觉越来越有大一统的趋势,SIFT、HOG这类型特征还是最最常用的,其核心思想也比较接近,都是方向梯度的直方图统计。也许随着神经科学的发展,会对特征的构造产生更多指导性的方向吧。但就目前来看,还构造啥特征啊,让计算机自己学去吧,学到啥就是啥,好用就行了~

最后链接一个感觉写的很不错的短文,对20年间的特征描述子做个简单回顾:《从特征描述符到深度学习》,http://cs2.swfc.edu.cn/~zyl/?p=2184&utm_source=tuicool&utm_medium=referral
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  特征 论文