一些特征杂记
2016-04-25 17:51
337 查看
1、 GIST
SpatialEnvelope : 空间包络
Given an input image, a GISTdescriptor is computed by
Convolve the image with 32 Gaborfilters at 4 scales, 8 orientations, producing 32 feature maps of the same sizeof the input image.
Divide each feature map into 16regions (by a 4x4 grid), and then average the feature values within eachregion.
Concatenate the 16 averagedvalues of all 32 feature maps, resulting in a 16x32=512 GIST descriptor.
Intuitively,GIST summarizes the gradient information (scales and orientations) fordifferent parts of an image, which provides a rough description (the gist) ofthe scene.
2、 DenseSIFT
它与SIFT(也叫sparse SIFT)的区别就在于它的获取过程是:对于图片中的每个像素,以该像素为中心,将它周围的一个16*16的区域分为4*4的单元,然后在每个单元中,用8个bins的直方图统计梯度方向,即可对每个像素得到一个4*4*8=128维的特征描述。
Dense SIFT和SIFT的区别就是:Lowe提出的SIFT算法中,会构建DOG尺度空间,从而进行关键点定位,然后计算每个关键点的128维的特征描述,而Dense SIFT是直接对图片中的每个像素,以该像素为中心,将它周围的一个16*16的区域分为4*4的单元,然后在每个单元中,用8个bins的直方图统计梯度方向,计算128维的特征描述.
很多应用中,证明Dense SIFT在场景或物体分类中取得的效果更好,并且速度更快。
在一些场景分类中,经常会先提取Dense SIFT,但是这样提取出来的特征数量太大,于是然后进行池化(如,max pooling……,就是把特征图像的某个区域求最大值,用来代表这个区域)
当研究目标是对同样的物体或者场景寻找对应关系(correspondence)时,Sparse SIFT更好。而研究目标是图像表示或者场景理解时,Dense SIFT更好,因为即使密集采样的区域不能够被准确匹配,这块区域也包含了表达图像内容的信息。
SpatialEnvelope : 空间包络
Given an input image, a GISTdescriptor is computed by
Convolve the image with 32 Gaborfilters at 4 scales, 8 orientations, producing 32 feature maps of the same sizeof the input image.
Divide each feature map into 16regions (by a 4x4 grid), and then average the feature values within eachregion.
Concatenate the 16 averagedvalues of all 32 feature maps, resulting in a 16x32=512 GIST descriptor.
Intuitively,GIST summarizes the gradient information (scales and orientations) fordifferent parts of an image, which provides a rough description (the gist) ofthe scene.
2、 DenseSIFT
它与SIFT(也叫sparse SIFT)的区别就在于它的获取过程是:对于图片中的每个像素,以该像素为中心,将它周围的一个16*16的区域分为4*4的单元,然后在每个单元中,用8个bins的直方图统计梯度方向,即可对每个像素得到一个4*4*8=128维的特征描述。
Dense SIFT和SIFT的区别就是:Lowe提出的SIFT算法中,会构建DOG尺度空间,从而进行关键点定位,然后计算每个关键点的128维的特征描述,而Dense SIFT是直接对图片中的每个像素,以该像素为中心,将它周围的一个16*16的区域分为4*4的单元,然后在每个单元中,用8个bins的直方图统计梯度方向,计算128维的特征描述.
很多应用中,证明Dense SIFT在场景或物体分类中取得的效果更好,并且速度更快。
在一些场景分类中,经常会先提取Dense SIFT,但是这样提取出来的特征数量太大,于是然后进行池化(如,max pooling……,就是把特征图像的某个区域求最大值,用来代表这个区域)
当研究目标是对同样的物体或者场景寻找对应关系(correspondence)时,Sparse SIFT更好。而研究目标是图像表示或者场景理解时,Dense SIFT更好,因为即使密集采样的区域不能够被准确匹配,这块区域也包含了表达图像内容的信息。
相关文章推荐
- php要解决的问题
- 设计模式 - 迭代器模式
- 序列化必须灭亡!
- EventSource
- 文件下载第二种方式--打包下载
- 虚拟机增加Ubuntu磁盘空间的方法
- Mybatis逆向工程的使用方法
- Android捕获全局异常信息并实现上传
- 欢迎使用CSDN-markdown编辑器
- python_笔记8_生成列表,列表表达式
- Linux 安装Mysql
- python和shell变量互相传递的几种方法
- 功率谱估计(转载)
- BOMStream BOMStreamWithFileAndSys
- Understanding G1 GC Logs
- 【图标管理工具】作为设计师,你不应该错过这个图标管理工具
- 通过ajax异步向后端发送请求,响应请求向前端传送json格式数据的实现思路
- [iOS适配-- launchImage]
- ListView 和CheckBox的批量删除问题的解决。
- 第三方库使用配置