特征词选择算法对文本分类准确率的影响(前言)
2010-08-17 22:23
477 查看
作者:finallyliuyu 注:数据使用请注明来源 试验数据下载 资源中包括 数据集规模为200,1000,2000,3000,情况下,特征维数分别为10,20,30-150的情况下5这交叉验证的全部正确率。其中文件命名为TextCategorization_0_100_10表示这是在文档集规模为200(一个类别中有100篇文章)下进行的第一折试验,当前特征维数为10。每个这样的文件夹下面包含文件train.libsvm(训练数据集),test.libsvm(测试数据集)以及最后试验得出的准确率accuracy.txt.(我在试验中libsvm采用的是线性核) 特征词选择算法对文本分类准确率的影响(一):讨论特征选择算法是否有效 特征词选择算法对文本分类准确率的影响(二):介绍本次实验的一些前提和基础以及中间数据格式等 特征词选择算法对文本分类准确率的影响(三):讨论特征词数量,VSM模型维数对分类准确率的影响,纠正特征词数目越多,VSM模型维数越高,分类越准确的观点 特征词选择算法对文本分类准确率的影响(四):在经典概率模型(课本论文中都是此模型)下的分类准确率 特征词选择算法对文本分类准确率的影响(五):在如我一样的layman设计的概率模型下分类准确率的情况 |
相关文章推荐
- 特征词选择算法对文本分类准确率的影响(四)
- 特征词选择算法对文本分类准确率的影响(五)
- 特征词选择算法对文本分类准确率的影响(二)
- 特征词选择算法对文本分类准确率的影响(三)
- 文本分类特征词选择算法科普(前言and一)
- 文本分类中的特征词选择算法系列科普(前言AND 一)
- 短文本/Query分类算法特征选择
- 文本分类入门(十)特征选择算法之开方检验
- 从文本分类问题中的特征词选择算法追踪如何将数学知识,数学理论迁移到实际工程中去
- 短文本/Query分类算法特征选择
- 文本分类入门:特征选择算法之开方检验、信息增益;特征选择与特征权重计算的区别
- 文本分类入门-特征选择算法之开方检验
- 文本分类入门特征选择算法之开方检验
- 文本分类入门(十)特征选择算法之开方检验
- 技术积累--常用的文本分类的特征选择算法
- Spark2.0 特征提取、转换、选择之二:特征选择、文本处理,以中文自然语言处理(情感分类为例)
- 文本分类入门-特征选择方法之信息增益
- 针对特征词选择法的验证实验“各种特征词选择算法对文本分类性能的影响”:纸上得来终觉浅,觉知此事要躬行
- 分类算法系列2----逻辑回归特征选择
- 文本特征选择的关键算法总结