朴素贝叶斯实现垃圾信息分类
2017-10-18 10:27
232 查看
朴素贝叶斯实现垃圾信息分类
代码github1.贝叶斯定义(贝叶斯算法介绍)
P(A|B) = P(B|A) * P(B) / P(A)
2.训练过程
中文分词(以下简称特征),过滤掉中英文符号,数字,字母,单个词 将所有特征组成一个去重的词向量列表 计算各个特征在所有分类下的概率
3.分类预测
将待分类数据,分词,向量化 根据贝叶斯公式计算各个分类下的概率,取最大概率即分类结果
4.优化
概率取对数,防止四舍五入对概率的影响 每个特征加1,防止单个特征概率为0
5.总结
训练9000条数据,预测2000条数据,正确率在95%左右 接下来还需要对特征进行处理,提高正确率,如过滤掉只出现一次的特征,加入语义相关性分析等
相关文章推荐
- 朴素贝叶斯实现垃圾邮件分类------matlab实现
- 基于朴素贝叶斯分类算法实现垃圾邮箱分类
- 朴素贝叶斯分类和预测算法的原理及实现
- 《机器学习实战》朴素贝叶斯分类及Sklearn库实现(2)
- 逻辑回归和朴素贝叶斯算法实现二值分类(matlab代码)
- 朴素贝叶斯分类算法python实现
- destoon实现资讯信息前面调用它所属分类的方法
- 基于ASP.NET MVC2 EntityFramework 实现的分类信息网站的原型!
- 商城项目-使用json模板实现带分类的产品规格信息存储及展示
- 用宏实现调试信息之分类过滤
- 朴素贝叶斯分类和预测算法的原理及实现
- <Machine Learning in Action >之二 朴素贝叶斯 C#实现文章分类
- Discuz! 搜索分类信息的字段的实现
- 商城项目-使用json模板实现带分类的产品规格信息存储及展示
- destoon实现资讯信息前面调用它所属分类的方法
- 商城项目-使用json模板实现带分类的产品规格信息存储及展示
- mysql无限级分类实现基于汇报关系的信息管理权限
- SVM实现垃圾邮件分类(java调用libsvm.jar)
- 朴素贝叶斯分类及python实现
- Java调用weka实现交叉验证,并输出分类信息