您的位置:首页 > 编程语言 > Python开发

Python数据挖掘建模_chapter_1

2017-11-04 10:55 281 查看
1.分类预测算法:
回归分析线性回归,非线性回归,Logistic回归,岭回归,主成分回归,偏最小二乘回归
决策树自顶向下递归,节点属性值比较
人工神经网络模仿大脑结构的信息处理系统
贝叶斯网络信度网络,不确定知识表达、推理领域有效的理论模型
支持向量机通过非线性映射,将低维非线性转为高维线性可分,在高维空间进行线性分析
1.1Logistic回归(线性相关分析)

模型:y取1和0概率比为p/1-p



#-*- coding: utf-8 -*-
#逻辑回归
import pandas as pd

#参数初始化
filename = 'math_model_data.xls'
data = pd.read_excel(filename)
x = data.iloc[:,:3].as_matrix()
y = data.iloc[:,3].as_matrix()

from sklearn.linear_model import LogisticRegression as LR
from sklearn.linear_model import RandomizedLogisticRegression as RLR
rlr = RLR() #建立随机逻辑回归模型
rlr.fit(x, y) #训练模型
rlr.get_support() #获取特征筛选结果
print rlr.scores_ #得分
print('%s'% ','.join(data.columns[rlr.get_support()]))
x = data[data.columns[rlr.get_support()]].as_matrix() #筛选好特征

lr = LR() #建立逻辑模型
lr.fit(x, y) #用筛选后的特征数据来训练模型
print('correct_point:%s' % lr.score(x, y)) #给出模型的平均正确率
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息