您的位置:首页 > Web前端

Task-Driven Feature Pooling for Image Classification(一种监督的pooling方法——TDFpooling)

2016-05-27 10:32 399 查看
本文发表在ICCV2015上



图像分类基本分为两个大方向,一个是BOW词袋模型,和cnn卷积神经网络模型,而pooling是分类非常重要的一个环节。该文章使用BOW提取 的原始特征(如sift等)或者cnn模型的特征map进行pooling。

首先该文章使用的分类器是LSR(最小二乘回归)。该论文的pooling方法是一种隐式的pooling方法,即没有直接的公式给出pooling公式,而是在分类器学习时候,学习出一种pooling模型。

本论文的pooling学习隐与分类器阶段,所以分成两个阶段,一个是训练阶段,一个是测试阶段。

训练阶段:

首先,原始的回归问题做分类都是学习一个



在这里使用F范数,使目标函数变成凸优化问题。

其中:



目标函数就是在寻找法向量W和偏移b使最终的损失最小。这是分类器最原始的优化函数,后来又引入复杂度于是又在目标函数中加入



使之目标函数变为:



没啥好说的,就是又降低损失又降低复杂度。

这些都是经典的回归分类问题,而本文的创新点就是用pool改进了这个优化函数,将pooling的学习隐入分类器学习。

使目标函数变为:



下面详细说一下pooling项:



最终的优化函数可以看出是在寻找一个分类,和pooling 损失和复杂度都最小的分类器。

下面说怎么优化目标函数:





固定了W,b之后他们成为常数,于是优化目标可以重写为:









之后完成了LSR分类器的学习。

以上为训练阶段

第二个阶段是测试阶段。

测试阶段:

测试阶段因为样本没有标签。

所以给出pooling目标函数:



优化后计算出pooling后的特征 :



然后将该特征扔入分类器:



想起一句话:

分类就是离散的回归

实验部分:

论文最终的实验使用了vd19的map特征进行进一步poolIng:

效果如下:











最后该文写的是一种pooling方法,加入个各种pooling的对比:


**
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: