您的位置：首页 > 其它

【分类——笔记01】基于稀疏编码的半监督图像分类研究

2014-12-14 14:22 295 查看

/******************************************************************************

1.《基于稀疏编码的半监督图像分类研究》

作者：陈汉英

学科：计算机应用技术

完成时间：2014年4月

******************************************************************************/

一、图像分类的步骤：

[1] 将视觉图像表示为数值信息，即图像表示。图像表示细分为图像特征提取、特征编码、特征相似性度量，对应模式识别的（模式表达、相似性度量、分类模型训练）

[2] 选择合适的分类器训练，得到分类模型

二、通过稀疏编码技术和空间金字塔匹配——图像表示

[1] 提取图像的SIFT特征作为训练数据，进行过完备字典学习

[2] 用稀疏编码，获得SIFT特征基于字典的稀疏编码重建系数

[3] 用空间金字塔匹配模型得到图像的数值向量表示形式

三、基于该方法的图像表示，可以采用线性核分类器如（线性支持向量机）进行分类。传统图像表示方法，只能采用非线性的SVM分类器才能达到较好的准确率

四、基于该方法的图像表示是高维空间中的稀疏向量，引入基于流形正则化的半监督学习方法。将未标记数据的结构信息作为一个正则化项加入传统分类其中，解决了实际应用汇总标签数据不足，通过融入为标记数据信息来提高分类准确率的问题。

五、基于稀疏编码空间金字塔匹配Sparse coding Spatial Pyramid Matching
模型的拉普拉斯支持向量机半监督图像分类

六、图像分类的应用：

[1] 网络图像检索：之前都是基于文本信息完成。90世纪基于视觉内容（Contented Based Image Retrieval）通过提取图像的特征：如颜色、轮廓等，基于这些特征找到相似图像，但有个新问题：如何解决图像潜在语义与抽象底层特征之间的语义鸿沟

[2] 生物特征识别，如指纹面像或者声音字迹等行为特征

研究现状

七、图像表示

[1] 90年代，主要通过获取图像全局特征：如颜色、纹理、轮廓来分类

[2] 2004年Lowe等提出了注入SIFT、SURF、PCA-SIFT等图像局部特征描述子，这些特征对图像的一些变换（如尺度拉伸、旋转、仿射等）具有保持不变形

[3] 2005Li等人提出词袋模型（Bagof Words，BoW）的概念，然后通过K-means等方法，运用大量图像的局部特征来训练得到一个视觉词典库，之后将每个图像的每个局部特征都按照某种相似性度量方法对应到视觉词典库的某个视觉单词，最后通知放图统计的方法来获得图像的向量表示。缺点词袋模型忽略了图像局部特征的位置分布关系。

[4] 2006年Lazebnik、Grauman 和Darrell等提出了空间金字塔匹配模型，充分考虑了图像局部特征的未知空间关系，通过结合词袋模型进行图像表示，有不错的分类效果，但是必须结合非线性核函数，才能有较好的分类模型。分类效率很低

[5] 2009Yang等基于稀疏编码技术学习过完备字典及图像局部特征的稀疏重建系数，结合图像空间金字塔匹配算法表示图像，并给予所获得的高维稀疏向量的图像表示来构建线性SVM分类器进行分类。

八、分类模型现状

[1] 早期的支持向量机模型（K.Goh et al，万学林）通过定义全局特征的欧氏距离来构建Mercer核函数

[2] 2004，Csurka首次将词袋模型用于图像表示，并且采用支持向量机进行图像分类。

[3] 2006，PLSA（Quelhas etal.2007；Bosch et al.2006）LDA（Li et al.2005）的高概率生成模型也被用于图像分类，通用思想把图像类别看成隐含主题，然后运用-PLSA\LDA等方法发现隐含主题。

[4] 为了能有效地融合图像的局部特征的围着信息，Lazebnik2006等人利用空间金字塔匹配模型来构建非线性SVM的SPM核函数。进一步改善了图像分类的性能。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航