您的位置：首页 > 其它

2013_Signal-Processing-Image-Communication泛读

2015-04-17 10:52 288 查看

一些关于mobile visual search的文章，网上下载不到原文。

阅读时间：2015-04-16

Rotation-invariant fast features for large-scale recognition and real-time tracking

这是一篇典型的特征点文章，作者Gabriel Takacs在文章中用了自己在CVPR10的RIFF描述子：Unified Real-Time Tracking and Recognition with Rotation-Invariant Fast Features。

关键点提取：

尺度空间局部极值点采用CenSurE算法（OpenCV中StarFeatureDetector），利用积分图像计算双层高斯拉普拉斯滤波器响应；

用Harris矩阵filter边缘响应；

关键点描述：

梯度方向直方图（HoG），增加了方向不变性（无需计算主方向）：

区别于方形网格cell，文章采用环形cell；

将g=(dx,dy)进行径向基投影后（投影后的值不因图像旋转而变化），再计算直方图；

径向基投影可以直接用方向梯度算子计算，这步用来加速。

计算梯度强度和方向时可以用lookup-table；

采用Compressed HoG的方式，压缩直方图数据———-CHoG仅发布了binary file（已测试ubuntu下能运行），作者说source code有rightcopy；

Laplacian embedding and key points topology verification for large scale mobile visual identification

二作Li Zhu前后在USA华为和USA三星工作过，文章关注最小化mobile请求传输bit率和最大化识别精度，提出了特征描述维度压缩和图像匹配方案。

特征维度压缩，作者也发在ICASSP2012：

相对PCA-SIFT，PCA是最小化数据误差的降维方法，文中提到应该最大化保留关键点间最近邻关系；

计算图像中所有特征点间的距离权重

XLXTAXLX^TA进行特征值分解，其中Di,i=∑jWij{D_{i,i}} = \sum\nolimits_j {{W_{ij}}} ，L=D−WL=D-W，求AA

计算压缩后的y，yi=ATxiy_i=A^Tx_i

图像匹配，图像S1中的所有关键点去匹配S2中的所有关键点，对于S1每一个点匹配时，级联步骤：

最近点/第二近点>T，；

图像S1中的匹配点总数/S1所有点>0.15；

如果没有过第2步，判断：图像S1中的匹配点总数>3；

后面的topology verification没看明白，看起来貌似对匹配到的关键点再做降维上的距离计算（不确定，留着以后有需要再研究）；

Selection of local features for visual search

在关键点传输时可以考虑减少关键点数量，文章提供了不同关键点数量时图片匹配的正确率。这是一篇实验性文章，没看到什么强有力的结论。作者Gianluca Francini公开了一个PPT，讲MPEG Compact Descriptors for Visual Search，应该是Telecom Italia在力推的 MPEG-7，链接，PPT中展示了一个很诱人的数据集，33590张图片，1M张干扰图，可惜没找到下载。

Multimedia search and retrieval using multimodal annotation propagation and indexing techniques

多媒体检索，数据源除了图像还有声音、3D信息、文本等，有点超出当前研究内容，文章没读。

JPSearch: An answer to the lack of standardization in mobile image retrieval

一种新的图片检索标准，是JPEG那边搞的，据说能与MPEG-7互补。但刚出来，具体内容未了解，等它发展起来了再关注。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航