您的位置:首页 > 其它

分类的基本概念

2013-09-01 15:14 197 查看
C4 分类
Classification:通过学习得到一个目标函数target function
f(也称为分类模型),把每个属性集x映射到一个预定义的类标号y
   //属性集:属性的集合,如{体温,胎生否,有腿否,冬眠否}
    建模的目的:
        描述性建模:用于描述某一类别对象的特征
        预测性建模:用于预测未知记录的类标号。通过样本学习得到预测模型,用该模型给位置对象分类:
          

  
    分类技术特点:
        1.适用于二元或标称类型的数据集
        2.对于有序分类,如(高收入,中等收入,低收入)不太有效,它不考虑有序数据之间的序列关系
        3.其他关系,如子类,超类等也会忽略。
        本章只讨论二元或标称类属性
4.2通用办法
        *决策树
        *基于规则
        *神经网络
        *支持向量机
        *朴素贝叶斯
    使用学习算法learning algorithm(也称为训练算法)确定分类模型。
        分类模型要求:不仅很好的拟合输入数据(样本),更要正确的预测未知数据的分类
        分类模型目标:具有很好的泛化能力模型(准确预测未知数据的分类)
    解决分类的一般过程:
[align=center][/align]
 
分类器的性能评估:性能度量 performance metric,如
    accuracy准确度=正确预测数/预测总数
        error rate 错误率=错误预测数/预测总数
 
                     
         
 
 
        
 
                
 
            
                    
                
        
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
            
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息