【Kaggle笔记】预测泰坦尼克号乘客生还情况(决策树)
2017-05-01 18:44
260 查看
数据集
泰坦尼克号乘客数据集代码
# -*- coding: utf-8 -*- """ 泰坦尼克号乘客生还情况预测 模型 决策树 """ # 导入pandas用于数据分析。 import pandas as pd # 利用pandas的read_csv模块直接从互联网收集泰坦尼克号乘客数据。 titanic = pd.read_csv('titanic.txt') # 机器学习有一个不太被初学者重视,并且耗时,但是十分重要的一环,特征的选择,这个需要基于一些背景知识。根据我们对这场事故的了解,sex, age, pclass这些都很有可能是决定幸免与否的关键因素。 X = titanic[['pclass', 'age', 'sex']] y = titanic['survived'] # 首先我们补充age里的数据,使用平均数或者中位数都是对模型偏离造成最小影响的策略。 X['age'].fillna(X['age'].mean(), inplace=True) # 数据分割。 from sklearn.cross_validation import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=33) # 我们使用scikit-learn.feature_extraction中的特征转换器,详见3.1.1.1特征抽取。 from sklearn.feature_extraction import DictVectorizer vec = DictVectorizer(sparse=False) # 转换特征后,我们发现凡是类别型的特征都单独剥离出来,独成一列特征,数值型的则保持不变。 X_train = vec.fit_transform(X_train.to_dict(orient='record')) # 同样需要对测试数据的特征进行转换。 X_test = vec.transform(X_test.to_dict(orient='record')) # 从sklearn.tree中导入决策树分类器。 from sklearn.tree import DecisionTreeClassifier # 使用默认配置初始化决策树分类器。 dtc = DecisionTreeClassifier() # 使用分割到的训练数据进行模型学习。 dtc.fit(X_train, y_train) # 用训练好的决策树模型对测试特征数据进行预测。 y_predict = dtc.predict(X_test) # 从sklearn.metrics导入classification_report。 from sklearn.metrics import classification_report # 输出预测准确性。 print(dtc.score(X_test, y_test)) # 输出更加详细的分类性能。 print(classification_report(y_predict, y_test, target_names = ['died', 'survived']))
效果
相关文章推荐
- 【机器学习实战】决策树预测Titanic遇难者生还情况
- Python 决策树 泰坦尼克号乘客是否生还决策模型
- 用sklearn(scikit-learn)的LogisticRegression预测titanic生还情况(kaggle)
- 机器学习之决策树预测——泰坦尼克号乘客数据实例
- R语言 logistic regression model预测泰坦尼克号生还情况
- 泰坦尼克号上的乘客是否生还的预测分析
- 【笔记】AI100-Kaggle竞赛_2017年房价预测
- 泰坦尼克号预测生还案例的分析(一)
- 数据科学工程师面试宝典系列之二---Python机器学习kaggle案例:泰坦尼克号船员获救预测
- 利用随机森林,xgboost,logistic回归,预测泰坦尼克号上面的乘客的获救概率
- python决策树泰坦尼克生还预测
- kaggle 泰坦尼克号生还者预测
- Kaggle 入门:探索泰坦尼克号事故幸存情况分析
- kaggle——泰坦尼克号生死预测
- 学习笔记:用决策树预测隐形眼镜类型
- 泰坦尼克号乘客生存分析--使用决策树
- (决策树)泰坦尼克号生还者简单预测
- 机器学习(1)-项目 0: 预测泰坦尼克号乘客生还率
- 数据科学工程师面试宝典系列之二---Python机器学习kaggle案例:泰坦尼克号船员获救预测
- Spark学习笔记——泰坦尼克生还预测