Python数据挖掘建模_chapter_1
2017-11-04 10:55
281 查看
1.分类预测算法:
1.1Logistic回归(线性相关分析)
模型:y取1和0概率比为p/1-p
#-*- coding: utf-8 -*-
#逻辑回归
import pandas as pd
#参数初始化
filename = 'math_model_data.xls'
data = pd.read_excel(filename)
x = data.iloc[:,:3].as_matrix()
y = data.iloc[:,3].as_matrix()
from sklearn.linear_model import LogisticRegression as LR
from sklearn.linear_model import RandomizedLogisticRegression as RLR
rlr = RLR() #建立随机逻辑回归模型
rlr.fit(x, y) #训练模型
rlr.get_support() #获取特征筛选结果
print rlr.scores_ #得分
print('%s'% ','.join(data.columns[rlr.get_support()]))
x = data[data.columns[rlr.get_support()]].as_matrix() #筛选好特征
lr = LR() #建立逻辑模型
lr.fit(x, y) #用筛选后的特征数据来训练模型
print('correct_point:%s' % lr.score(x, y)) #给出模型的平均正确率
回归分析 | 线性回归,非线性回归,Logistic回归,岭回归,主成分回归,偏最小二乘回归 |
决策树 | 自顶向下递归,节点属性值比较 |
人工神经网络 | 模仿大脑结构的信息处理系统 |
贝叶斯网络 | 信度网络,不确定知识表达、推理领域有效的理论模型 |
支持向量机 | 通过非线性映射,将低维非线性转为高维线性可分,在高维空间进行线性分析 |
模型:y取1和0概率比为p/1-p
#-*- coding: utf-8 -*-
#逻辑回归
import pandas as pd
#参数初始化
filename = 'math_model_data.xls'
data = pd.read_excel(filename)
x = data.iloc[:,:3].as_matrix()
y = data.iloc[:,3].as_matrix()
from sklearn.linear_model import LogisticRegression as LR
from sklearn.linear_model import RandomizedLogisticRegression as RLR
rlr = RLR() #建立随机逻辑回归模型
rlr.fit(x, y) #训练模型
rlr.get_support() #获取特征筛选结果
print rlr.scores_ #得分
print('%s'% ','.join(data.columns[rlr.get_support()]))
x = data[data.columns[rlr.get_support()]].as_matrix() #筛选好特征
lr = LR() #建立逻辑模型
lr.fit(x, y) #用筛选后的特征数据来训练模型
print('correct_point:%s' % lr.score(x, y)) #给出模型的平均正确率
相关文章推荐
- Python数据挖掘建模 chapter_3 聚类
- Python数据挖掘建模 chapter_7 关联规则
- Python数据挖掘建模 chapter_2决策树
- Python数据挖掘建模 chapter_4 相关性分析
- Python数据挖掘建模 chapter_8 时间序列算法
- Python数据挖掘建模 chapter_6 主成分分析(简)
- Python数据挖掘建模 chapter_5 神经网络算法
- 【Python数据分析】2nd-挖掘建模
- Python数据分析与挖掘实战—挖掘建模
- 『Python数据分析与挖掘实战』第五章:挖掘建模
- Python笔记-数据挖掘建模过程
- 你用 Python 做过什么有趣的数据挖掘项目
- Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
- 大数据学习笔记之四十 数据挖掘算法之预测建模关于决策树模型的介绍
- Python数据采集处理分析挖掘可视化应用实例
- python数据挖掘包matplotlib绘图
- 常见数据挖掘算法和Python简单实现
- python 数据挖掘 版本 环境变量
- 《利用Python进行数据挖掘》
- 【python】《Python数据挖掘入门与实践》实验环境搭建