机器学习实战——第七章:处理非均衡分类问题
2015-06-24 10:17
399 查看
在前面六章的所有分类介绍中,我们都假设所有类别的分类代价是一样的。
坦白地说,在大多数情况下不同类别的分类代价并不相等,如治病我们情愿误判也不愿漏判,垃圾邮件,可以使收件箱里出现垃圾邮件,但不希望正常邮件放进垃圾邮件夹中。
在本节中,我们将会考察一种新的分类器性能度量方法,并通过图像技术来对在上述非均衡问题。
1、混淆矩阵:争取率、召回率
2、ROC曲线:接受者操作特征曲线receiver operating characteristic corve,AUC(曲线下的面积,area under the curve)能够近似表示分类器的平均性能值。
3、基于代价函数的分类器决策控制:实际上就是对不同类别的样本赋予不同的权重,关注程度不同
4、通过欠抽样和过抽样来调节样本,以关注不同的类别
坦白地说,在大多数情况下不同类别的分类代价并不相等,如治病我们情愿误判也不愿漏判,垃圾邮件,可以使收件箱里出现垃圾邮件,但不希望正常邮件放进垃圾邮件夹中。
在本节中,我们将会考察一种新的分类器性能度量方法,并通过图像技术来对在上述非均衡问题。
1、混淆矩阵:争取率、召回率
2、ROC曲线:接受者操作特征曲线receiver operating characteristic corve,AUC(曲线下的面积,area under the curve)能够近似表示分类器的平均性能值。
3、基于代价函数的分类器决策控制:实际上就是对不同类别的样本赋予不同的权重,关注程度不同
4、通过欠抽样和过抽样来调节样本,以关注不同的类别
相关文章推荐
- “.网络”域名市场报告:排名保持不变(6月23日)
- Keepalived报错解决
- android TypedValue.applyDimension()代码转换dp,sp
- IT技能
- 编译安装GCCa
- 修改Active Directory域控制器IP地址
- wdcp的环境搭建shell脚本分析--lanmp.sh---lib/mysql.sh
- 使用CocoaPods来做iOS程序的包依赖管理
- Nodejs简单应用,自制的烽烟注册系统说明
- dialog点击屏幕不消失
- Linux信号(signal) 机制分析
- MFC 子对话框之间互相发送消息的方案
- 关于不同设备下载同一张图片适配问题
- iOS 模拟终端控件
- SQL with(unlock)与with(readpast) (转)
- 如何写一个简单的手写识别算法?
- 学校网站制作该从哪几方面去思考去制作
- ajax是否能跨域请求,解决的办法
- 用注解方式实现springMVC
- 【性能诊断】九、并发场景的性能分析(windbg案例,Fist Chance Exception/Crash dump)