您的位置:首页 > 其它

2013_Signal-Processing-Image-Communication泛读

2015-04-17 10:52 288 查看
一些关于mobile visual search的文章,网上下载不到原文。

阅读时间:2015-04-16

Rotation-invariant fast features for large-scale recognition and real-time tracking

这是一篇典型的特征点文章,作者Gabriel Takacs在文章中用了自己在CVPR10的RIFF描述子:Unified Real-Time Tracking and Recognition with Rotation-Invariant Fast Features。

关键点提取:

尺度空间局部极值点采用CenSurE算法(OpenCV中StarFeatureDetector),利用积分图像计算双层高斯拉普拉斯滤波器响应;





用Harris矩阵filter边缘响应;

关键点描述:

梯度方向直方图(HoG),增加了方向不变性(无需计算主方向):

区别于方形网格cell,文章采用环形cell;

将g=(dx,dy)进行径向基投影后(投影后的值不因图像旋转而变化),再计算直方图;

径向基投影可以直接用方向梯度算子计算,这步用来加速。



计算梯度强度和方向时可以用lookup-table;

采用Compressed HoG的方式,压缩直方图数据———-CHoG仅发布了binary file(已测试ubuntu下能运行),作者说source code有rightcopy;

Laplacian embedding and key points topology verification for large scale mobile visual identification

二作Li Zhu前后在USA华为和USA三星工作过,文章关注最小化mobile请求传输bit率和最大化识别精度,提出了特征描述维度压缩和图像匹配方案。

特征维度压缩,作者也发在ICASSP2012:

相对PCA-SIFT,PCA是最小化数据误差的降维方法,文中提到应该最大化保留关键点间最近邻关系

计算图像中所有特征点间的距离权重



XLXTAXLX^TA进行特征值分解,其中Di,i=∑jWij{D_{i,i}} = \sum\nolimits_j {{W_{ij}}} ,L=D−WL=D-W,求AA

计算压缩后的y,yi=ATxiy_i=A^Tx_i

图像匹配,图像S1中的所有关键点去匹配S2中的所有关键点,对于S1每一个点匹配时,级联步骤:

最近点/第二近点>T,;

图像S1中的匹配点总数/S1所有点>0.15;

如果没有过第2步,判断:图像S1中的匹配点总数>3;

后面的topology verification没看明白,看起来貌似对匹配到的关键点再做降维上的距离计算(不确定,留着以后有需要再研究);

Selection of local features for visual search

在关键点传输时可以考虑减少关键点数量,文章提供了不同关键点数量时图片匹配的正确率。这是一篇实验性文章,没看到什么强有力的结论。作者Gianluca Francini公开了一个PPT,讲MPEG Compact Descriptors for Visual Search,应该是Telecom Italia在力推的 MPEG-7,链接,PPT中展示了一个很诱人的数据集,33590张图片,1M张干扰图,可惜没找到下载。

Multimedia search and retrieval using multimodal annotation propagation and indexing techniques

多媒体检索,数据源除了图像还有声音、3D信息、文本等,有点超出当前研究内容,文章没读。

JPSearch: An answer to the lack of standardization in mobile image retrieval

一种新的图片检索标准,是JPEG那边搞的,据说能与MPEG-7互补。但刚出来,具体内容未了解,等它发展起来了再关注。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: