论文提要“Filtered Channel Features for Pedestrian Detection”
2015-09-06 17:00
423 查看
增加中间层,对底层特征使用滤波器组进行滤波,并使用boosted 决策树进行分类,可以提升行人检测率。最近比较好的人检测方法均在底层特征和分类器之间增加量中间层,如最大池化,滤波等。本文使用了滤波器组对图像进行卷积。文章提出的滤波器组框架如下图所示。仅使用HOG+LUV在Caltech和KITTI数据库上可获得最好的效果。
相关研究
最近的行人检测综述表明不同的分类器,如SVM和决策树,对检测结果影响不大,而使用何种特征显得更为重要。
不同的特征包括HOG,LBP,Colour,local structure,Covariance,使用CNN学习的特征,光流,深度图等。
目前最好的行人检测方法都是基于HOG+LUV方法(ChnFtrs)的扩展,包括SquaresChnFtrs,InformedHaar和LDCF。RegionLets在广义物体检测上的效果比较好。
FCF
ChnFtrs,SquaresChnFtrs,ACF均用了图1中上半部分的结构。输入图像转换为一系列特征图,通过对一大群矩形区域进行sum-pooling得到最终的特征向量。之后将特征送入决策树使用AdaBoost学习。树上的节点对特征值和学到的阈值进行简单的比较。通常决策树只学习了特征向量的子集。AdaBoost同时进行筛选特征和学习节点的阈值。
sum-pooling 可以使用滤波器族进行卷积,之后读取卷积响应图的单个值。这就是FCF。
基线方法包括ACF和InformedHaar。
参数:特征通道仅使用HOG+LUV,最终的分类器包括4096个2层的决策树,使用普通的离散AdaBoost,树通过穷举贪心搜索每个节点实现,模型大小为60*120像素,使用四轮难样本挖掘实现。滑动窗步长为6个像素。
特征族介绍
InformedFilters,去除了InformedHaar中的位置限制,总共有212个滤波器,在10个通道上使用,等同于在2120个通道上训练决策树。对于60*120大小的模型,每个通道有200个特征(步长为6),总共得到2120*200个特征。AdaBoost筛选了其中的~3%。
Checkboards,滤波器大小与InformedHaar类似,滤波器数目与最大尺寸有关,4*4cell对应61个滤波器。
RandomFilters,给定滤波器数目和最大尺寸,根据均匀分布随机创建。
LDCF,使用学习到的PCA特征向量作为滤波器。
PcaForeground,LDCF使用所有训练数据学习滤波器,PcaForeground训练了8个滤波器,4个由背景图像学到,4个由行人块学到。
滤波器形状如下图所示:
滤波器数目对结果的影响
如下图所示,滤波器数目为50时MR最小,不同滤波器对结果影响不大。
数据增加对结果的影响
使用Caltech10x和更深层的决策树对结果的影响如下表,L4是甜点。
另外,使用RealAdaboost效果比discrete AdaBoost效果好,下表为不同要素对结果的影响
数据增加对不同方法结果的影响
不同方法使用光流和训练数据增强对结果的影响
相关研究
最近的行人检测综述表明不同的分类器,如SVM和决策树,对检测结果影响不大,而使用何种特征显得更为重要。
不同的特征包括HOG,LBP,Colour,local structure,Covariance,使用CNN学习的特征,光流,深度图等。
目前最好的行人检测方法都是基于HOG+LUV方法(ChnFtrs)的扩展,包括SquaresChnFtrs,InformedHaar和LDCF。RegionLets在广义物体检测上的效果比较好。
FCF
ChnFtrs,SquaresChnFtrs,ACF均用了图1中上半部分的结构。输入图像转换为一系列特征图,通过对一大群矩形区域进行sum-pooling得到最终的特征向量。之后将特征送入决策树使用AdaBoost学习。树上的节点对特征值和学到的阈值进行简单的比较。通常决策树只学习了特征向量的子集。AdaBoost同时进行筛选特征和学习节点的阈值。
sum-pooling 可以使用滤波器族进行卷积,之后读取卷积响应图的单个值。这就是FCF。
基线方法包括ACF和InformedHaar。
参数:特征通道仅使用HOG+LUV,最终的分类器包括4096个2层的决策树,使用普通的离散AdaBoost,树通过穷举贪心搜索每个节点实现,模型大小为60*120像素,使用四轮难样本挖掘实现。滑动窗步长为6个像素。
特征族介绍
InformedFilters,去除了InformedHaar中的位置限制,总共有212个滤波器,在10个通道上使用,等同于在2120个通道上训练决策树。对于60*120大小的模型,每个通道有200个特征(步长为6),总共得到2120*200个特征。AdaBoost筛选了其中的~3%。
Checkboards,滤波器大小与InformedHaar类似,滤波器数目与最大尺寸有关,4*4cell对应61个滤波器。
RandomFilters,给定滤波器数目和最大尺寸,根据均匀分布随机创建。
LDCF,使用学习到的PCA特征向量作为滤波器。
PcaForeground,LDCF使用所有训练数据学习滤波器,PcaForeground训练了8个滤波器,4个由背景图像学到,4个由行人块学到。
滤波器形状如下图所示:
滤波器数目对结果的影响
如下图所示,滤波器数目为50时MR最小,不同滤波器对结果影响不大。
数据增加对结果的影响
使用Caltech10x和更深层的决策树对结果的影响如下表,L4是甜点。
另外,使用RealAdaboost效果比discrete AdaBoost效果好,下表为不同要素对结果的影响
数据增加对不同方法结果的影响
不同方法使用光流和训练数据增强对结果的影响
相关文章推荐
- 如何将一个HTML页面嵌套在另一个页面中
- UVA 211 The Domino Effect
- [剑指offer] 扑克牌的顺子
- css中table tr:nth-child(even)改变tr背景颜色: IE7,8无效
- jQuery 实现 九九乘法表
- 纯javascript代码编写计算器程序
- json之注意
- js实现的Easy Tabs选项卡用法实例
- JavaScript基础进阶知识汇总
- javascript的for...in
- angular在线验证用户名是否唯一 指令
- JS fso 处理
- 基于jQuery+PHP+Mysql实现在线拍照和在线浏览照片
- HTML 水平对齐方式总结
- jsp笔记
- 未能加载文件或程序集“Newtonsoft.Json, Version=4.5.0.0, Culture=neutral, PublicKeyToken=30ad4fe6b2a6aeed”或它的某一个依赖项。
- 制作一个可拖动的html对话框
- 解决$.ajax()请求异常~ jQuery提示parsererror错误解决办法
- js格式化日期、金额
- Node.js 初窥