二分类问题特征选择的常用两个方法
2014-06-25 22:04
393 查看
二分类问题特征选择的常用两个方法
by dylanfan at 2014-6-25
(1)互信息。值越大,相关性越强
![](http://img.blog.csdn.net/20140625220251828)
w是特征,t是目标。反应的是特征出现和不出现对目标值的影响。
(2) 卡方检验
![](http://img.blog.csdn.net/20140625220309750)
其中 A = N(w = 1, t = 1)、 B = N(w = 1, t = 0)、 C = N(w = 0, t = 1)、 D = N(w =
0, t = 0)
![](http://img.blog.csdn.net/20140625220626781)
卡方值越大,相关性越强。
卡方检验是统计假设特征和目标值独立不相关,然后从实际分布结果来看是否拒绝原假设。卡方值越高,拒绝的概率越高。
下面是个卡方值对应的分布图。
by dylanfan at 2014-6-25
(1)互信息。值越大,相关性越强
w是特征,t是目标。反应的是特征出现和不出现对目标值的影响。
(2) 卡方检验
其中 A = N(w = 1, t = 1)、 B = N(w = 1, t = 0)、 C = N(w = 0, t = 1)、 D = N(w =
0, t = 0)
卡方值越大,相关性越强。
卡方检验是统计假设特征和目标值独立不相关,然后从实际分布结果来看是否拒绝原假设。卡方值越高,拒绝的概率越高。
下面是个卡方值对应的分布图。
相关文章推荐
- 常用文本分类特征选择方法
- 文本分类特征选择方法之信息增益
- 文本建模常用的预处理方法——特征选择方法(CHI和IG)
- 结合Scikit-learn介绍几种常用的特征选择方法
- 干货:结合Scikit-learn介绍几种常用的特征选择方法
- 干货:结合Scikit-learn介绍几种常用的特征选择方法
- 结合Scikit-learn介绍几种常用的特征选择方法
- 文本分类入门-特征选择方法之信息增益
- [转]干货:结合Scikit-learn介绍几种常用的特征选择方法
- 常用图像特征提取方法分类
- 结合Scikit-learn介绍几种常用的特征选择方法
- 100w特征,2000个类别的分类问题,好的解决方法
- 分类问题 特征向量的归一化方法
- 文本分类入门-特征选择方法之信息增益
- 结合Scikit-learn介绍几种常用的特征选择方法
- 文本分类入门(十一)特征选择方法之信息增益 (转)
- 文本分类入门(十一)特征选择方法之信息增益
- 借助weka实现的分类器进行针对文本分类问题的特征词选择实验(实验代码备份)
- 文本分类特征选择方法——卡方检验信息增益
- 技术积累--常用的文本分类的特征选择算法