说说那些机器学习中的性能度量方式
2017-02-22 20:49
183 查看
说说那些机器学习中的性能度量方式
主要分为两类问题- * 分类问题 *
- * 回归问题 *
一、回归问题
在回归问题中,最常用的性能度量方式是: 最小均方误差1msumni=0(f(xi)−yi)2
更一般的,对于数据集D 和概率密度p ,均方误差可以描述为:
1m∫i−D(f(x)−y)2p(x)
二、分类
在分类问题中,使用的性能度量主要有以下几种:- 准确率
- 召回率
- F1度量
主要利用混淆矩阵
预测 | ||
---|---|---|
真实 | 真 | 假 |
真 | TP | FN |
假 | FP | TN |
召回率=TPTP+FN
F1=2TP2TP+FN+FP
在sklearn 中的用法主要使用sklearn 中的cross_validation 模块中的cross_val_score方法
# -*-coding:utf-8 -*- import pandas as pd import numpy as np from sklearn.cross_validation import train_test_split from sklearn.cross_validation import cross_val_score from sklearn import datasets from sklearn import svm iris = datasets.load_iris() xtrain,xtest,ytrain,ytest=train_test_split(iris.data,iris.target,test_size=0.4,random_state=0) clf = svm.SVC(kernel='linear',C=1).fit(xtrain,ytrain) print clf.score(xtest,ytest) print cross_val_score(clf,iris.data,iris.target,cv=5,scoring='precision_macro') print cross_val_score(clf,iris.data,iris.target,cv=5,scoring='recall_macro') print cross_val_score(clf,iris.data,iris.target,cv=5,scoring='f1_macro')
输出 结果为:
0.966666666667 [ 0.96969697 1. 0.96969697 0.96969697 1. ] [ 0.96666667 1. 0.96666667 0.96666667 1. ] [ 0.96658312 1. 0.96658312 0.96658312 1. ]
ROC、AUC
先占个坑。。有时间把他补全
相关文章推荐
- 机器学习之分类模型的性能度量
- 机器学习之性能度量
- 机器学习 —— 性能度量和比较检验、模型评估方法
- 机器学习实战笔记(Python实现)-07-模型评估与分类性能度量
- 【机器学习】分类性能度量指标 : ROC曲线、AUC值、正确率、召回率、敏感度、特异度
- 机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率
- 机器学习之性能度量
- 【机器学习杂货铺】——性能度量(暂缺)
- 机器学习知识点(三十六)分类器性能度量指标f1-score
- 机器学习性能度量指标:AUC
- 【机器学习-西瓜书】九、聚类:性能度量;距离计算
- 机器学习之分类模型的性能度量
- 机器学习中性能度量(错诶率、精度、查准率、查全率、F)
- 【机器学习-西瓜书】二、性能度量:召回率;P-R曲线;F1值;ROC;AUC
- 机器学习: 性能度量
- 周志华《机器学习》 学习笔记(四) 性能度量
- 机器学习笔记(六)性能度量
- 机器学习模型性能度量
- 机器学习笔记 - 性能度量
- 机器学习之性能度量